※ 引述《kingx163 (果醬貓)》之銘言:
: 各位版友好
: 小弟剛接觸影像辨識沒有多久
: 看到目前有yolo, Azure Computer Vision,
: Cloud Vision API等等可以選擇
: 請問各位年薪300w大大都用哪一種呢?
: 另外,應該如何判斷用哪家的呢?
: 謝謝!
YOLO是model
Azure Computer Vision跟Google Cloud Vision API都是platform
你應該先釐清你的需求,才知道要用何種工具/framework/model
不然就像是問網友出發要搭啥交通工具,卻連要去哪裡都沒說一樣
我最近也自學Computer Vision/Machine Learning,可以給你一點建議
有些需求AOI就可以解決,有些用CV效果會更好,有些需要用到ML其良率才能接受
如果剛接觸這塊,可以先玩一下OpenCV,看一些早期的論文
了解一下以前在做CV時是怎麼用GLCM,小波之類的特徵去辨識
現在如果不是自己從頭寫,已經不太會接觸到這塊了
直接拿現成Model network去使用或train都難度很低
剛好這幾天做了個投影片,你可以參考一下,簡單展示了CV跟ML可以做的東西
https://goo.gl/SYEvbe (一直按 > 就可以照著flow播了)
據我自學的認知,Machine Learning裡,
跟CV比較有關的就是Classification跟Object Recognition
簡單來說Classification就是辨識這張圖是啥
Object Recognition是認出圖內的物體位置與名稱,你說的YOLO就是這種
屬於R-CNN家族之一,它家族大概是這樣:
R-CNN, Fast R-CNN, Faster R-CNN, YOLO, SSD, R-FCN....(最後一個我沒試過)
如果只是想做Computer Vision,建議你玩OpenCV
如果要用Machine Learning,我前陣子有寫篇很雜的心得在fb社團
https://www.facebook.com/groups/616369245163622/permalink/1204406499693224/
那時候邊忙邊寫,寫得很亂也沒整理,簡單來說是這樣
平台: linux/ubuntu最多人用,windows資源比較少
語言: C++/python吃遍天下,其他語言看運氣
Framework:Caffe還是最多,tensforflow最近比較熱門,Keras似乎也不少人用
Torch有點老了,CNTK微軟努力推當中(至少社群回應蠻熱情的)
如果你只是想測效果,用OpenCV DNN Moudle去讀 Model來測
找到你需要的model再選擇要用怎麼環境改成production
這樣可以少花很多時間在建置環境上
大致上是這樣,如果要問怎麼建模的話我還沒學到那,只會很簡單的CNN,就幫不上忙了