※ 引述《cylee (Artisan)》之銘言
: Hi 各位先進,
: 本人背景是畢業很久的資工碩,目前從事 infra 開發的 back-end
: engineer,目前待的公司準時上下班,想學些能累積技術的主題
: 熟悉的語言有: C++/Python/Rust
: 因為在學時完全沒接觸過,想請問有碰過的先進們,自學的話有沒
: 有推的書、公開課能分享。另外 NLP 現在業界真的拿它來賺錢的公
: 司/組織是不是偏少(台商),還是只是我沒碰到而已?
: 謝謝各位
基本上,可以先從傳統的NLP領域開始切入,傳統計算語言學的問題主要有Tokenizer、POS
、Entity Extraction、Dependency Tree、Relation Mapping、Intent Classification、S
ummarize、Coreference Resolution、Questions Answer、Language Translation等這些問
題開始下手。
如果沒修過相關課程可以直接去聽Stanford 的線上公開課程,有直接從傳統統計語言角度
跟問題直接切入的,然後再慢慢進一步走到用DL的方法,本質上傳統跟Neural的角度也不用
擔心差很多,了解傳統統計模型方法像HMM CRF這種會幫助你理解更多,怎麼透過傳統角度
切換到DL角度。
然後當前比較重要的NLP領域基底就是Language Model(或是你會聽到詞嵌入Word Embedding
都是一樣的),這個會在你做上述問題的時候會套用的預訓練模型,你可以初部把他直接理
解為一個特徵轉換器,可以把複雜高維特徵降維方便模型理解的方法。然後還有去理解一下
Self-supervised learning 方法,AR跟AE的自監督訓練方法差異,想解決的問題。
剩下你想搞一些上層的應用大概就是這些問題組合拳一套,做ChatBot在加上一點IR的東西
加上樹搜索就完成了。
然後想從書學的話,我推薦這本 Speech and Language Processing,這本大概就是聖經,
也是Stanford 的教授寫的,剩下就是多讀文獻。
搞NLP比較弱勢的可能就是業界應用會比較要媒體、廣告相關去找會比較有應用空間,早期
有搭上車銀行做監控跟客服這塊也是有應用,不過這幾年找得人就比較少了,或是這幾年智
能合約也會應用到NLP,我自己今年就被兩家幣商找過想去做這塊研究。
以上