※ 引述《techniclaire (齁齁)》之銘言:
: (本文作者無帳號,協助代po ^ ^~)
: 前文少po段落就送出,因手機一直無法編輯,所以刪文重發QQ
: 大家好,
: 小弟目前在台北某傳產擔任數據分析師,學歷是國立統計所,碩論是做 ML 演算法改良(沒投期刊,我覺得是垃圾),碩班期間有自修 DL。
: 希望能用 DL 找工作,主力程式為 Python。
: 目前剛進去公司半年多,主要負責影像辨識的專案,內容是用 Yolo 進行 real time 的瑕疵檢測,專案目前也已經上線了,因此算是有一些實務經驗。
: 看了蠻多 ptt 上的文,對目前 AI/DL 工作的現況總結如下:
: - 做 DL 的人已經爛大街了,幾乎每個實驗室都在做 AI
: - 想做演算法 / 模型開發的話至少要念到博士
: - 基礎資工能力非常重要,沒人要只會 DL 的人
: - 刷 Leetcode
: 考慮以上、總結目前目標是成為一個「能將現有較新的 DL 方法應用在公司產品上」的工程師,希望將來能到聯發科、瑞昱等一線 IC 設計公司工作。
: 目前我想到的進修方向如下:
: - 持續關注 AI/DL 的發展,了解現在的趨勢,並且參加一些像是T-brain、Kaggle 之類的比賽。
: - 修李宏毅老師的 ML 相關課程,我這學期有跟著寫一些 ML 作業,覺得自己的 Pytorch 熟悉度有提高很多
: - 學 C++ (主要是看到如果模型要應用的話還是得用到 C++,而且有些模型像是 Yolo 也是用 C++ 寫的)
: - 把資料結構及演算法學好,刷 Leetcode
: - 做一個深度學習專案,例如把 Yolo 模型遷入到手機中
: - 增進英文能力,方便吸收國外資源及看論文的速度,有沒有推薦內向人的英文口說學習資料或是補習班。
: - 其他,例如增進簡報能力
: 想請問各位先進,我目前的想法有需要調整的地方嗎(or 打掉重練qq)
本人工作6年多
目前經歷的兩份工作都跟ML相關(預測相關)
依照本人的經驗 我會建議兩個可能的方向
其他方向或許也有機會 不過我不太熟就不發表意見了
(1) 認真打 kaggle
假設你可以長期都可以solo拿到銀牌 (可能每天二三個小時)
(金牌需要非常多的時間,運算資源,運氣 很難強求)
尤其是不參考別人 我覺得都有相當的能力
依照我的了解 台灣真的kaggle打得好的人其實很少
而且不少公司都在找這些人
這些人有相當的市場價值
本人雖然已經非常久沒有打kaggle了
但我覺得打kaggle的人有一些特質
第一是他們會減少一些信仰, 讓結果說話
相對於沒經驗的人 他們可能會更小心的設計 validation set
並且跑過相當次數 驗證 validation set / test set 進步的一致性
正常人可能隨便就選了 n-fold cv / train-validation 的架構
然後就開始grid search hyperparameter
然後有一些感覺上很有道理 (paper上哪個模型比哪個模型好, 一些很直覺的feature)
但實際上卻不怎麼work的事情 會接二連三的發生
一些小到讓人覺得微不足道卻影響最後的事情 也會接二連三的發生
因為每幾個月就換一次比賽 你內心可能就會改變各種方法的信心度
書本上教的A方法 信心度可能從95% -> 60%
討論區看到讓人半信半疑的方法 信心度可能從40% -> 80%
所以對於大部分的問題 你會有一個武器庫
從信心度最高的一個一個試
另外因為資料會有些微的不一樣
所以每次你可能要快速地想 benchmark 跟 處理一些雜事
我覺得這個過程大概可以到你打完一個比賽覺得自己什麼都沒有學到就差不多了
(2) 找一些結果相當容易量化的 project 來做
結果相當容易量化的通常都是只target明確 比較不是偏 unsupervised 的題目
盡可能的讓target的成效變好
比如 預測台股 扣除掉模型的差距
你可以學習如何爬資料(三大法人, 期貨, 分點, 財報)
你會長期覺得現在是試新資料比較重要還是新模型比較重要
如果你能把預測變成交易策略 搞不好還可以發財(?
這樣別人在問你project的時候 才可以讓面試官覺得你可以把一個題目做到很深
不會一下就卡住了
我自己覺得這兩個方向的人都蠻吸引人的
以我自己的感覺來說(主觀)
這樣的能力 會比用套件跑了某個結果 然後呈現在某個app或者網頁上的人吸引人