作者:
meokay (我可以)
2019-05-27 00:04:11大家好,打給厚
最近小弟在看一些NLP的相關工作
有一種感覺是
台灣對於這一塊的需求不是那麼高?
不知道是做的產業比較沒有相關
還是說對於這一塊的發展比較沒那麼重視?
不知道大家對於NLP這一塊有沒有什麼想法
歡迎大家提出來討論~
謝謝大家
作者:
chengcti (版主請投我一票!)
2019-05-27 00:33:00什麼是NLP?
作者: snuriver103 (熙熙) 2019-05-27 00:47:00
Neuro-Linguistic Programming ???
作者: acelp (未來,一直來一直來) 2019-05-27 07:44:00
NLP ASR 國外已經蠻成熟了
作者:
DrTech (竹科管理處網軍研發人員)
2019-05-27 09:05:00你打開google 搜一下,買網購搜商品,用到多少NLP ,做點功課都不會?至於說NLP, 有通用解,買大廠API 的,肯定不在這行業做事啦。沒通用解。NLP 成熟? 也不是現況吧。
作者:
ejnfu ((-. .-)b)
2019-05-27 09:58:00原po問的也還好吧,這麼凶
作者: kiwi94217 (kiwi) 2019-05-27 10:36:00
以做了一些NLP專案還有修課也面了幾間之後的感想是,繁體中文資源不足(語料庫),簡體用語無法移植,歧異詞,模型跨領域效能低等等技術問題,從論文研究到企業實作,都無法克服這些障礙,即時有解,商業應用也是很大的難題
作者: transforman 2019-05-27 10:43:00
投資報酬率很低的領域
Dr.tech在中國工作 的確中文NLP還有很多挑戰
作者:
qwer911 (NIEONEONE)
2019-05-27 12:49:00個人覺得全部輸google
作者:
shter (飛梭之影)
2019-05-27 12:58:00比起語句的理解,我覺得更難處理的是記憶(前後對話關聯)
作者:
chupiggy (機器人)
2019-05-27 13:01:00光是中文斷詞跟NER就還有很多研究空間了其實
作者: acelp (未來,一直來一直來) 2019-05-27 14:44:00
NLP在英文語系已經不是太大的問題 對於一般語句跟目前應用是足夠了 而中文缺乏的就只是單純詞庫 語法的問題 這都可以克服的至於文章理解 已經到NLU更深入的範疇了
作者:
chienk (.................)
2019-05-27 15:21:00如果做出來只能給台灣人用 那經濟規模不足以撐起這個產業
作者:
w199381 (噁心肥宅)
2019-05-27 17:03:00近幾年的papers有提出說相近意思的文字在space上很近不知道後續有沒有繼續發展出一個one-for-all的技術?
作者: acelp (未來,一直來一直來) 2019-05-27 19:17:00
word embedded or vector 就已經算是one for all了
作者:
drph (Peter)
2019-05-27 19:22:00學校請自己寫學校作業
作者:
DrTech (竹科管理處網軍研發人員)
2019-05-27 21:44:00釣出一堆外行人。目前還沒出現通用的word embedding技術。word2vec 到現在的各種預訓練語言模型,例如bert。 都還不能跨領域來用。簡單的一詞多義,word embedding 都沒辦法跨領域有不同的表示了,只能換不同的 corpus 重新訓練。至於投資報酬率低更是誤解。google 最大營收,廣告收入,就是NLP學得好的例子與方向。更不用說台灣現在爛到爆炸的購物商品推薦,也是市場上商機最清楚的機器學習應用點。BERT 模型,看起來通用,實際上在各領域或各種 task , 還不是要在神經網路架構上層, 重新訓練。所以個人認為,目前很難有萬用模型啦。
作者: acelp (未來,一直來一直來) 2019-05-27 22:16:00
誰跟你說過word embedded 是通用的?不同應用本來就要重train...如果你要萬能模型 請慢慢等吧 台灣做不出來就是這種短視近利 國外ASR NLP都做多久了 而且要相互搭配台灣過去根本沒基礎 又短視近利 又想一步登天 這才是好笑的地方
不是阿 萬用模型 本然就是指 你可以用那個架構重train不過短短幾行推文 也難以了解彼此意思 不過直接喊外行也是太偏激了點就是
作者: transforman 2019-05-27 23:05:00
少加了點字,在台灣報酬率低
NLP會說通用解是指應用情境 很難差異化 資料大者通吃翻譯 購物推薦 ASR 都可以看出誰是領先者然後換個語言和情境 多一種排列組合不然想聽聽DrTech 對GPT2在寫文章上的領先有什麼高見
作者:
DrTech (竹科管理處網軍研發人員)
2019-05-27 23:50:00抱歉,短短推文的確有誤解。感謝你後來的說明,看懂了。
作者:
Arnol (還是太淺了)
2019-05-28 09:19:00我只會PLP
作者: acelp (未來,一直來一直來) 2019-05-28 09:36:00
澄清是誤會就好 台灣這塊真的落後不少 學界當初也做得不夠深入 甚至都轉組 現在潮流一變遷就只能找海歸了
作者:
chengcti (版主請投我一票!)
2019-05-28 11:04:00你知道直銷 最愛用NLP
作者: eatpupu (吃大便) 2019-05-28 11:08:00
NLP 本來就是坑,語言是被人類定義出來的東西
作者:
chienk (.................)
2019-05-28 17:00:00不是國外風風火火的東西 都適合拿回來台灣做 台灣需要認清處自己在世界產業中間的位置