Re: [請益] 想從零開始轉行當AI軟體工程師

作者: alden (這真是太危險啦)   2021-11-12 05:42:12
我來散佈一些正能量好了
小弟在FANG的英國的一個一直賠錢的AI子公司工作4+年了。
其實我覺得數學真的沒那麼重要,除非你是要做理論的。
又不是每個人都是Ian Goodfellow, Ashish Vaswani, 還是 David Silver.
就算是這些重要的工作,也不見得數學有很深吧?
我的數學只有高中程度而已,還是能follow他們的works.
(BTW, 我不是科班的。所以數學只有高中程度)
我的觀察啦,能寫出好的bug free code 比數學或統計好要來得更重要。
畢竟大家還是都在接水管。只有很少很少部分的人在improve水管。
怎麼import tensorflow/pytorch/jax, 把該接的東西接一接其實比較實在。
所以說到底,還是刷題比較實在。先確定有基本的algo/ds的實力。
我看國外machine learning engineer / data scientist的opening
應該還是很多吧。
我的理解MLE的interview也是主要考leetcode XD
台灣的情況我就不清楚了。
ML還是滿有趣的。希望有多一些人能加入。不要被一些自己預設的條件嚇到了。
程式寫好(python is good enough. I see nothing wrong with python)
會接基本的DL model. 有高中程度的機率,統計.
再刷一下Leetcode. 你也可以apply FANG 的MLE哦 XD
再多說一點,其他方面的能力也是很重要的。
基本的英文溝通,準備preso,和別人解釋code/model的能力。
這些其實我都覺得比數學好要重要太多了。
當然,數學能好當然更好。這一直是我的痛點。
不過在大公司接水管真的不太有機會用到.
Just my 2 cents. :)
作者: niobafrog (NIOBA)   2021-11-12 06:11:00
該不會是DeepMind吧...跪
作者: empliu (善惡相殺)   2021-11-12 07:18:00
感覺原po隱藏蠻多重要訊息的原po的高中是建中 ...大學是台大 然後有 PhD 學位 = =這種重要背景資訊還是留一下 不然會誤導人 ..
作者: alden (這真是太危險啦)   2021-11-12 07:33:00
是建中,但不是台大。有PhD,但不是數學物理或CS... :p
作者: drajan (EasoN)   2021-11-12 07:57:00
數學不好真痛 小弟也是在英國FANG但不是直接做 modeling雖然 engineering這種工作也很重要 但就是感覺沒有 research scientist或ML engineer這種雙修的來得厲害如果「只是」engineering 的職位確實leetcode重要性要大於數學多的多了 畢竟能改變世界的模型就那些人在搞 基礎的工程還是需要有人做
作者: KingSteven (HHung)   2021-11-12 09:18:00
DeepMind先跪……管他賠不賠錢,有神先跪再說……
作者: fr75 (阿巴 )   2021-11-12 09:54:00
原po有Phd 應該是國外大學的 不能這樣推薦人 國外公司最愛找Phd的 尤其是研發類 人家看到一個phd想做水管工當然巴不得你進啊
作者: BigHeadDoggy (大頭狗仔)   2021-11-12 10:22:00
會接基本的DL model. 有高中程度的機率,統計.再刷一下Leetcode. 你也可以apply FANG 的MLE哦 XD你知道自己在說什麼嗎
作者: stmilk (我男的)   2021-11-12 10:52:00
我沒在那個世界待過我實在也不知道數學到底重不重要。“上帝關一扇門會開另一扇窗“,這句話不管是心靈層面還是實務層面都很實在,而且我不喜歡怨天尤人,所以我現在也是乖乖刷leetcode和補充現在一堆公司要求的distributionsystem的底,好險之前資料結構和演算法其實讀很多遍刷起來挺快樂的,不確定這條路是不是相對好的選擇,但試試沒損失。
作者: everglow (jm)   2021-11-12 11:31:00
這篇太樂觀了 這正向到有點偏離現實太遠了國外FANNG本來就很愛找phd不管有無跟AI相關的人來做ML而且你應該又是很早進入這個領域的 這樣比較不太公平事實上 數學重要嗎 很重要 但實務上要大量用到數學的缺根本少到可以
作者: alden (這真是太危險啦)   2021-11-12 11:40:00
嗯。早個5年的bar真的低很多。而且台灣這個領域的求職看起來比國外競爭多了!
作者: everglow (jm)   2021-11-12 11:53:00
台灣是產業問題 ai無法做大 缺太少了不過我相信原po這麼優秀 哪個時間點都可以相對容易找現在一堆都要leetcode 連DS考online assessment成常態了某方面來說 也是要刷leetcode ...
作者: DrTech (竹科管理處網軍研發人員)   2021-11-12 12:34:00
連Google 在發很多重要論文,都沒在用數學,還很多人一直把數學推導神話,沒必要。做出效果來最重要啦,慢慢推什麼數學。搞不好我甚至覺得,大家都是沒靠數學做出效果,再來為了投稿堆出數學的。數學好不好,會不會推導,在業界真的是很微乎其微的重要。效果無法證實,在哪慢慢推數學理論,根本上不了檯面。去搞傳統BI,做統計都比做AI還更需要數學。工程師這三個字,就代表了,工程結果最重要了。要算數學可以去找科學家,研究員職缺。在哪慢慢推數學根本推不出來 BERT, Transformer之流的方法才是真的。Transformer模型架構為什麼大放異彩,數學也證實不出來。這也是現況。實務結果證實後,發表時才會回去推數學。一般正常工程師,根本做不到這塊。
作者: everglow (jm)   2021-11-12 13:19:00
很認同 所以面試在那邊考推導準備證明根本有事嗎
作者: kiwi946946 (kiwi)   2021-11-12 13:35:00
會考大概是面試者沒有能呈現的做品經歷,那面試官也只能考這個了
作者: recorriendo (孟新)   2021-11-12 13:38:00
Google是Google啊 它甚至發ethics論文大家也都搶著引用 用這個當判準很奇怪Transformer就是需要一點矩陣數學推導才能把self attention這個idea變成code啊 (不然就會變成很醜的nested for loop)當然接水管的是沒差 不過說不懂數學就可以發明LSTM、Transformer太誇張了這串我覺得很多是talking past each other 大多數人提數學是這個層級的推導 可能這些對有PhD的大大們真的是像加減乘除一樣簡單 所以才會說不需要很多數學實際上相對普通SWE這確實是"很多"了
作者: empliu (善惡相殺)   2021-11-12 14:17:00
直接來看 Deepmind 的 publications 列表吧https://deepmind.com/research這裡說的數學也不是說你數學要多強不過至少要不討厭數學 而且最基本的那幾科有學好
作者: humanfly (laguna@HEADSHOT)   2021-11-12 14:36:00
感謝大大的勵志文
作者: DrTech (竹科管理處網軍研發人員)   2021-11-12 15:36:00
所以到底你們版上誰的工作有在投論文的?比例是多少? 只會講,拿出證據吧。誰在用 transformer時,會需要去推導數學,或推導了數學對工作實務有什麼幫助?拿別人少數研究員的工作在說 個,AI工程師的工作需要數學,數學推導,有夠奇怪。人家是要轉行當 AI工程師,不是要轉行當 AI科學家,AI界大牛耶。別人要當個普通 AI工程師,你們拿科學家的標準來強調:不要當科學家。跳針跳得太誇張。
作者: alden (這真是太危險啦)   2021-11-12 15:45:00
推DrTech 重點還是工程師三個字
作者: DrTech (竹科管理處網軍研發人員)   2021-11-12 15:46:00
如果今天標題是:如何轉行當研究員,科學家。你們這些天天在強調數學的人才合理吧。
作者: stmilk (我男的)   2021-11-12 15:53:00
google那篇我是不知道正常工程師會理解到哪啦,我稍微看一下在有時間壓力的情況下應該會先簡單理解說:這個訓練可以逼近他們那個定義的應該算可以接受的bias區間,然後定理一就是說這個演算法得出來的東西就是會滿足他們那個定義,定理二在說這個玩意兒還超屌的訓練時還會有一個上界不會飄的太嚴重,雖然他們沒有討論這個上界夠不夠緊XD,所以應該還是有個前提是訓練的模型存在。然後就實作了因為也不難XD這篇論文真的有夠學術的,的確工程界根本不屌什麼bias什麼的,能上就好。工程界真的要討論的話統計的bias定義又根本不能用,因為只有上帝才知道他們要找的pattern長什麼樣子哈哈哈這個在台灣要被實作出來應該還是要等某些英文很好的中國人(因為我看網路上好像中國人很熱衷翻譯這些東西)把它的步驟寫出來,然後說一下心得才會有台灣人開始實作吧哈哈哈阿上面說的”訓練模型存在”不太精確,精確地說是這個要找的問題的解存在,因為現實應用這個假設不一定成立XD解不存在那訓練時就是放飛自我哪裡都有可能跑了哈哈哈最後是可以理解這個在工程界應該應用不大因為一般的bias影響不會太嚴重,但對精度要求很重的工業(台積電?)可能就會需要了而這個訓練除了剃度下降還要更新那兩個我的理解應該可以算是限制函數的東西,這就是成本XD
作者: libitum (libitum)   2021-11-12 16:05:00
在講什麼東西啊 工程師=工程界? 工程界是什麼??最好是一個AI engineer完全不考慮bias啦...台灣業界要不要實作為什麼要等到中國人有人翻譯跟心得啊有需求就會去做啊 心得國外一堆 英文又沒那麼難
作者: recorriendo (孟新)   2021-11-12 16:08:00
隨便舉個例子啦 pytorch要選optimizer 當然要懂點數學才能知道adam是在幹嘛吧 除非你真的土法煉鋼把所有選項都試一遍 那如果需要選擇的地方有很多個 你的選項組合就指數級爆炸了 根本不可能一個一個試
作者: stmilk (我男的)   2021-11-12 16:08:00
好吧我道歉那樣說不對,對不起。然後我也不要代表工程界好了至少我之前工作的地方不在乎。
作者: libitum (libitum)   2021-11-12 16:12:00
不在乎bias? 那你前公司拿什麼來當evaluation metrics
作者: recorriendo (孟新)   2021-11-12 16:12:00
不然去stackoverflow去查哪個選項比較好 把答案背起來 解釋都不管 (因為解釋至少都牽扯一些數學) 是這樣嗎??
作者: stmilk (我男的)   2021-11-12 16:14:00
痾....你先去看論文我們再來討論= =
作者: recorriendo (孟新)   2021-11-12 16:15:00
事實就是 就算只是AI engineer 工作上會碰到的數學一定比普通SWE多很多 這到底有什麼好反駁的
作者: stmilk (我男的)   2021-11-12 16:18:00
樓上這不就長久以來要數學不要數學的大戰嗎XD
作者: Murasaki0110 (麥當勞歡樂送)   2021-11-12 16:20:00
我也在FANG, 最賭爛的就是沒ML背景的MLE跑來問model為什麼要吐array 不能吐dict嗎
作者: Zoanthropy ($$)   2021-11-12 16:21:00
有拿來預測股價嗎?
作者: stmilk (我男的)   2021-11-12 16:22:00
乾樓上XDDDDDDD
作者: Murasaki0110 (麥當勞歡樂送)   2021-11-12 16:22:00
沒人要你做research, 但這些基礎都沒有是要做啥
作者: recorriendo (孟新)   2021-11-12 16:22:00
原PO 我不是回你喔 你原文根本沒提到Transformer、發paper
作者: pttano (pttano)   2021-11-12 16:38:00
說得好,原原po去巨匠過過水也穩領五六萬起薪,哈哈
作者: recorriendo (孟新)   2021-11-12 16:43:00
原原PO問"從零開始"喔 確定機率、微積分、線代對他來說是基本嗎??確實不知原原PO的背景 不過某Dr講的好像就算文組轉職AI都不用唸一點數學一樣
作者: ohmylove347 (米特巴爾)   2021-11-12 17:17:00
Deepmind真的要跪了…可是這樂觀的講法不就像愛因斯坦說微積分考前翻一下就好了嗎XD
作者: final01 (牛頓運動定律)   2021-11-12 18:43:00
deepmind還有其他台灣人??
作者: fallcolor (秋天走了)   2021-11-12 18:48:00
transformer裡的核心self-attention的數學特性很多paper分析過了吧
作者: niobafrog (NIOBA)   2021-11-12 19:05:00
有點好奇原Po的實際工作內容,畢竟大家都知道DeepMind做為全世界頂尖的AI Company,工作內容是在focus的研究新領域並且發Top conference的論文嗎? 還少那部分是只有特定的Researcher在進行呢? 謝謝抱歉 手機打字排版有問題,不好閱讀
作者: aiueokaki   2021-11-12 19:12:00
這系列真的釣到神人了XD
作者: soccer103 (Ferrari)   2021-11-12 20:19:00
神人推 但太過倖存者症候群給箭頭
作者: newhandfun (新手方)   2021-11-12 20:27:00
太樂觀
作者: KingSteven (HHung)   2021-11-12 21:47:00
推文有些不是很認同。在AI領域,工程師跟科學家的界線有時候不該分這麼開。工程師就不用懂AI的數學也是蠻不好的,有些數學你不懂,就等於是限制自己的天花板,更別提ICLR、NeurIPS也是很多數學推導的paper啊,這些都是對整體AI的演進是有幫助的,但寫這些paper就只能是科學家?不一定吧…至少tier-1公司不會這樣限制之前面西雅圖微軟的一個engineer職位,面試官也是要我當場推導softmax和cross-entropy的back propagation啊……
作者: Morphee (千磨萬擊還堅勁)   2021-11-12 22:04:00
這種大學等級的推導到底算啥麼數學阿 笑死機率、微積分、線代不是都大一的東東 扯一堆幹嘛
作者: mmonkeyboyy (great)   2021-11-12 22:07:00
沒有人說不用數學啊....只是數學拿來幹嘛用而已你要拿來看懂別寫的東西就很夠要強到拿來開發新東西那是另一回事最近美國太多ml人 所以就只好用考的來去掉一些啊對啊= =" 不過說什麼數學的 要能用數學解決新東西不是總在那賣弄我看得懂我會算....(很多人都會懂啊)懶得在那裡扯而已
作者: Morphee (千磨萬擊還堅勁)   2021-11-12 22:16:00
如果你要做的題目 建中生也拿得到資料 你真的做得贏他嗎?我覺得先問這個就夠了 如果有信心就做 沒信心至少換個domain 資料是建中生拿不到的 不然穩死阿 還沒提市場勒弄出來了 結果不好意思商湯也有賣算法 比養你便宜老闆手指算一算 哪天沒錢買跑車了 把算法組全改去做別的
作者: mmonkeyboyy (great)   2021-11-12 22:20:00
說到中國....這行業更是結合人多的優勢
作者: johnboygo (nube)   2021-11-13 01:02:00
我也覺得這系列討論是大家對數學好的定義不一樣XD對理科背景的人來說微積分、線性代數叫常識不算會數學對轉職的人來講可能微積分跟線性代數就是難的數學了
作者: j0958322080 (Tidus)   2021-11-13 01:18:00
真的,要考也考個四為 Stoke's thm
作者: johnboygo (nube)   2021-11-13 01:48:00
懂數學至少要會Lebesgue Integral吧
作者: yyhsiu (hsiu)   2021-11-13 04:32:00
推樓上 數學好的定義沒講清楚就先戰成一團了原po覺得都沒在用數學 (我會相信),但對某些人來說可能一直都在用了
作者: mao9201 (茂)   2021-11-13 10:15:00
項目換成更進階的real analysis, commutative algebra也不過是數學研究的入門磚而已...真的不要輕易說自己數學程度很好
作者: kevin820308 (fdsfssdas)   2021-11-13 13:31:00
不推XD 有點像我學醫朋友說雅思7.5 不是大學水準嗎
作者: asleisureto (ASLE)   2021-11-13 16:03:00
原po講的好像高中畢業刷個幾題就能進faang一樣那我也可以說高中補個習考上醫牙,也沒很難呀
作者: RumiManiac (Rumi!)   2021-11-14 13:22:00
終於有人講到了,數學好都沒定義清楚也能戰成一團...
作者: bowin (盡其在我)   2021-11-16 06:54:00
推Alden好文分享!
作者: alksjdf (Loop)   2021-11-16 20:29:00
感謝分享 感覺FANG不管什麼缺都可以用SWE去準備...只要leetcode刷好刷滿 他甚至不會考你其他專業問題?

Links booklink

Contact Us: admin [ a t ] ucptt.com