Re: [心得] 資料科學家工作分享與 AI 產業觀察

作者: aacs0130 (湛靈)   2019-03-08 03:05:30
※ 引述《aacs0130 (嘻嘻莉亞)》之銘言:
: === 先說結論 ===
:
: 1. 非CS背景想轉職 AI => 念四大碩,主修 AI
:
: 2. 不想念碩士,想自學
: => 證明你比四大碩強 => 去社群給 Talk or Kaggle 比到前三
: 社群有 ML/DM Monday, Taipei.py, Py data 等等
: 有個聽眾覺得『哎唷不錯喔』,機會就來了
:
: 3. 已經是資工碩了
: => 去社群給 Talk or 發top conference paper ex: AAAI, NAACL
:
: 推 Transfat: 轉職又非即戰力,是不是沒希望了 03/07 17:03
: 推 ckp4131025: 大家都只要即戰力,市場當然很缺senior囉 03/07 17:33
: 老實說我覺得這是台灣 AI 圈的困境
: 一來 AI 圈也才紅5年,Sr. 本來就不多
: 二來 很多 Sr. 都跑去美國了
: 三來 Jr. 沒人帶也沒有自學能力就不能變Sr.,只會變成Super Junior
: 四來 老闆都希望Sr. 免費加班帶Jr. 還要加班做專案
無法訓練Sr. 可能是台灣的困境了
一群 Junior 一起學習就像 unsupervised learning
有Sr.帶的Jr. 就像 supervised learning
F-score起跑點就差20%
unsupervised learning 很難強過 supervised learning
Sr. 必須要能帶人,帶team,什麼 data 都能做
Jr. 通常都需要定義明確的問題跟目標
但是 real data 常常都沒有問題也沒有目標
客戶根本不知道他想要什麼
客戶:幫我做一個有AI的東西
DS:什麼有AI的東西?
客戶:這是你的專業吧
DS: 你有什麼data?
客戶:我就是找你來告訴我的
DS: 你要什麼?
客戶:幫我做一個有AI的東西
============
Jr. DS:沒有問題也沒有目標怎麼做?
Sr. DS:Time => Day, Week, Month, Year, Weekday, Weekend, ....
==>> A 跟 C 組,F 跟 K 組
==>> 喔!這是吃的 or 擦的 or 用的
Jr. DS:為什麼你知道怎麼做?
Sr. DS:這就是資料科學家的直覺...呃...經驗...
: 推 LinuxKernel: 要開示一下哪些是假AI新創嗎 03/07 17:49
你可以看該公司的網頁
成立兩年卻沒有亮眼產品或賺錢的可能有問題
也可以看該公司員工的LinkedIn
如果語焉不詳,寫得很怪的,充滿Super Junior的也很雷
還有 Head Hunter 推薦的80%都很雷
AI圈中黑掉的公司最愛找hunter
: 推 vn509942: 這幾年很多金主對AI題材有莫名的期待 03/08 01:40
菜市場阿嬤愛 AI,客戶愛, 金主愛,老闆最愛
有遇過一些客戶拿了一堆data來
不要省錢,不要加速,不要找商業邏輯
搞了半天客戶就是要"AI"
我就是要用 data 做出有 AI 的東西
然後簽字 畫押 領錢
然後客戶就放新聞稿說他們的產品有AI,是AI概念股
客戶滿意,老闆滿意,大家發大財
作者: mirror0227 (鏡子)   2019-03-08 07:42:00
你那是客戶還是chatbot
作者: MOONY135 (談無慾)   2019-03-08 08:11:00
感覺有些接案也很像啊
作者: sxy67230 (charlesgg)   2019-03-08 08:25:00
基本上都是這樣,客戶任務都是要靠自己兜出來,主管或是客戶還會都這個有莫名的幻想,覺得DL訓練出來的東西應該跟天網一樣強大。然後主管期待過後就是失望,最後開始說ML,DL不work
作者: pelicanper (派立肯)   2019-03-08 09:10:00
unsupervised 跟 supervised類比?
作者: plover (喜歡你 ( ̄▽ ̄#)﹏﹏)   2019-03-08 10:22:00
現實世界就是 unsupervised 遠多於 supervised資料那麼多根本標不完..
作者: aacs0130 (湛靈)   2019-03-08 11:15:00
對呀,現實世界Unsupervised 超多
作者: dddddd67 (斷水流大師兄)   2019-03-08 12:43:00
接案的工作都是會遇到天兵客戶
作者: ZuiYang (Zui)   2019-03-08 12:43:00
還好我的工作只是用Ai來解決一些issue而已,好的Ai產品的門檻真的太高了
作者: kasimEnix (碰一張)   2019-03-08 12:52:00
我還以為這種對話只會出現在設計業...沒想到
作者: a126sam01 (北川景子是我的老婆>///<)   2019-03-08 14:09:00
感覺這位大神學長/姊,對客戶有著滿滿der怨念wwwwww
作者: littlethe (東周流浪漢)   2019-03-08 14:35:00
這個就是台灣沒管理觀念的問題了,各行各業都有這狀況小公司就很喜歡用低薪請一堆外行人瞎搞,結果就比大學生作業還差不專業的人為了搶功就一直鬥,只好花大部分時間在處理人問題,變成台灣職場很難學到東西
作者: aiueokaki   2019-03-08 14:41:00
接案公司?
作者: a126sam01 (北川景子是我的老婆>///<)   2019-03-08 15:47:00
推little大的論點,這的確是在鬼島各行業都會發生的問題,所以其實Junior進來後,也要多觀察Senior與Team Leader 的政治鬥爭能力XDDD
作者: littlethe (東周流浪漢)   2019-03-08 16:58:00
唉!說到這個我也是很痛心,也許我也就是大家所謂的super junior,但我根本就不想這樣,我也想變成senior但又進不到好的公司,只能在沒制度的公司一直待,然後還是學不到東西,眼睜睜的看著我的年紀老去我現在不敢自學了,決定要去進修,學真正的方法有結果的話,我也來版上發一篇心得文這是我唯一能同時增強數學,英文,工程的方法了自己學,只能學到API這類的皮毛,但理論思維學不到
作者: MOONY135 (談無慾)   2019-03-08 17:37:00
....越講我也越傷心
作者: ice80712 (我很有事)   2019-03-08 18:55:00
幹嘛要執著於ai?即將要泡沫的東西
作者: Morphee (千磨萬擊還堅勁)   2019-03-08 19:01:00
不認同你的類比 人不是機器 比得就是誰的學習跟思維方式強大 自比為機器 很怪
作者: ripple0129 (perry tsai)   2019-03-08 19:18:00
為什麼自學沒辦法學理論
作者: windom2001 (MARK)   2019-03-08 19:22:00
想請教大大,不知您對金融業做AI的看法如何呢?謝謝
作者: twilighthook (嚕嘟)   2019-03-08 19:56:00
自學如果要學理論 大概就是學一學 打掉重來N次後才會懂
作者: aacs0130 (湛靈)   2019-03-08 20:23:00
自學當然可以學理論。比較難自學就是{{直覺跟經驗}}
作者: littlethe (東周流浪漢)   2019-03-08 20:32:00
因為自學的話,沒有人來糾正你,打個比方吧,有修過DB的人一定都知道正規化,但是很多業界非本科的人用了10年DB,還是不知道正規化,表就靠自己感覺開,覺得反正可以跑就好,在這種情況下,我還真不敢說這10年的老鳥有比本科大學生懂DB現在也是滿街的人在"自學"大數據或AI,懂的人有幾個?
作者: sxy67230 (charlesgg)   2019-03-08 20:43:00
自學理論可以,雖然基礎都有學過,但一堆新的model也只能自學。而且這個行業的理論目前一直都在更新,幾年前跟幾年後的紅的模型都不一樣。我念書那個年代HMM做時序建模,分類用SVM就超屌了,那個時候NN還被我們教授說是garbage,現在看到教授的專業上掛了類神經網路。
作者: BBSealion (海獅)   2019-03-08 21:16:00
樓上+1 我也是學生時代NN被說是死掉的領域XDDD
作者: vincentman (Vincent)   2019-03-08 22:21:00
所以NN是起死回生,還是死灰復燃?wwww
作者: sxy67230 (charlesgg)   2019-03-08 22:33:00
被谷歌吵紅的,當然google沒有hiton或是goodfellow這些大神也沒辦法火起來
作者: a126sam01 (北川景子是我的老婆>///<)   2019-03-08 23:05:00
所以如果要在這行走得遠,就只能先從熱門領域加減賺然後往更冷門的領域鑽研,期待哪天自己的領域能夠火XD
作者: y800122155 (@__@)   2019-03-08 23:12:00
以前我老闆也都說NN不就是個Nonlinear Model
作者: DrTech (竹科管理處網軍研發人員)   2019-03-09 00:52:00
NN到現在,都不是萬用阿,怎麼說得好像NN是唯一解了。
作者: aacs0130 (湛靈)   2019-03-09 03:10:00
NN是因為有GPU,硬體升級才死灰復燃,現在紅的是DNN很多教授以前嘲笑NN,現在改說自己20年前就做NN了但是紅的是DNN = Deep Learning<不是NN
作者: DrTech (竹科管理處網軍研發人員)   2019-03-09 09:10:00
DNN也不是唯一解阿,現實工作,除非你做CV, 或是外行半調子,哪來一開始就硬套任何DNN 架構。現在一堆課程,尤其是速成班,一上來就天花亂墜的cnn,rnn,tensorflow… 在實際工作有好處,也有很多負面壞處。太多時候硬套模型不能解決現實問題。
作者: massacre (該換暱稱了@@)   2019-03-09 10:38:00
我想業界應該不少老闆被洗腦以為用DNN就變成超級賽亞人以前我去金融業面試 面試官說的好像用上DNN就屌打巴菲特當我說出實話 對方好像就覺得你太嫩了先去練練再來吧看到原po的文 我才能理解原來對方要的是Super Junior
作者: aacs0130 (湛靈)   2019-03-09 12:00:00
對呀,大部分業界的問題不需要DNN
作者: viper9709 (阿達)   2019-03-11 20:48:00
推現實
作者: ray308 (ray308)   2019-03-13 10:55:00
模型都是假的 以後會泡沫
作者: ruokcnn (Dean)   2019-03-16 14:14:00
一堆jr DS 彼此train起來至少慢有人帶的狀況3倍

Links booklink

Contact Us: admin [ a t ] ucptt.com