[討論] 台灣對於NLP這一塊的未來性

作者: meokay (我可以)   2019-05-27 00:04:11
大家好,打給厚
最近小弟在看一些NLP的相關工作
有一種感覺是
台灣對於這一塊的需求不是那麼高?
不知道是做的產業比較沒有相關
還是說對於這一塊的發展比較沒那麼重視?
不知道大家對於NLP這一塊有沒有什麼想法
歡迎大家提出來討論~
謝謝大家
作者: colin8930 (magiccc)   2019-05-27 00:09:00
作業自己作
作者: w60904max (自宅警備隊員)   2019-05-27 00:28:00
容易有通用解 交給大廠優化 買API就好
作者: chengcti (版主請投我一票!)   2019-05-27 00:33:00
什麼是NLP?
作者: snuriver103 (熙熙)   2019-05-27 00:47:00
Neuro-Linguistic Programming ???
作者: mmonkeyboyy (great)   2019-05-27 04:24:00
作業自己做不然去找正妹教授問
作者: spirit119 (精神分裂)   2019-05-27 06:50:00
還以為你是心理系的
作者: acelp (未來,一直來一直來)   2019-05-27 07:44:00
NLP ASR 國外已經蠻成熟了
作者: foodordertw (foororderTW)   2019-05-27 08:32:00
跟职棒草创10年一样感觉
作者: scott0327 (yoyoyo)   2019-05-27 08:52:00
不會問教授哦?如過教授也不知道那他就不夠格
作者: DrTech (竹科管理處網軍研發人員)   2019-05-27 09:05:00
你打開google 搜一下,買網購搜商品,用到多少NLP ,做點功課都不會?至於說NLP, 有通用解,買大廠API 的,肯定不在這行業做事啦。沒通用解。NLP 成熟? 也不是現況吧。
作者: ejnfu ((-. .-)b)   2019-05-27 09:58:00
原po問的也還好吧,這麼凶
作者: kiwi94217 (kiwi)   2019-05-27 10:36:00
以做了一些NLP專案還有修課也面了幾間之後的感想是,繁體中文資源不足(語料庫),簡體用語無法移植,歧異詞,模型跨領域效能低等等技術問題,從論文研究到企業實作,都無法克服這些障礙,即時有解,商業應用也是很大的難題
作者: transforman   2019-05-27 10:43:00
投資報酬率很低的領域
作者: w60904max (自宅警備隊員)   2019-05-27 12:03:00
Dr.tech在中國工作 的確中文NLP還有很多挑戰
作者: qwer911 (NIEONEONE)   2019-05-27 12:49:00
個人覺得全部輸google
作者: shter (飛梭之影)   2019-05-27 12:58:00
比起語句的理解,我覺得更難處理的是記憶(前後對話關聯)
作者: chupiggy (機器人)   2019-05-27 13:01:00
光是中文斷詞跟NER就還有很多研究空間了其實
作者: acelp (未來,一直來一直來)   2019-05-27 14:44:00
NLP在英文語系已經不是太大的問題 對於一般語句跟目前應用是足夠了 而中文缺乏的就只是單純詞庫 語法的問題 這都可以克服的至於文章理解 已經到NLU更深入的範疇了
作者: chienk (.................)   2019-05-27 15:21:00
如果做出來只能給台灣人用 那經濟規模不足以撐起這個產業
作者: w199381 (噁心肥宅)   2019-05-27 17:03:00
近幾年的papers有提出說相近意思的文字在space上很近不知道後續有沒有繼續發展出一個one-for-all的技術?
作者: acelp (未來,一直來一直來)   2019-05-27 19:17:00
word embedded or vector 就已經算是one for all了
作者: drph (Peter)   2019-05-27 19:22:00
學校請自己寫學校作業
作者: DrTech (竹科管理處網軍研發人員)   2019-05-27 21:44:00
釣出一堆外行人。目前還沒出現通用的word embedding技術。word2vec 到現在的各種預訓練語言模型,例如bert。 都還不能跨領域來用。簡單的一詞多義,word embedding 都沒辦法跨領域有不同的表示了,只能換不同的 corpus 重新訓練。至於投資報酬率低更是誤解。google 最大營收,廣告收入,就是NLP學得好的例子與方向。更不用說台灣現在爛到爆炸的購物商品推薦,也是市場上商機最清楚的機器學習應用點。BERT 模型,看起來通用,實際上在各領域或各種 task , 還不是要在神經網路架構上層, 重新訓練。所以個人認為,目前很難有萬用模型啦。
作者: acelp (未來,一直來一直來)   2019-05-27 22:16:00
誰跟你說過word embedded 是通用的?不同應用本來就要重train...如果你要萬能模型 請慢慢等吧 台灣做不出來就是這種短視近利 國外ASR NLP都做多久了 而且要相互搭配台灣過去根本沒基礎 又短視近利 又想一步登天 這才是好笑的地方
作者: w60904max (自宅警備隊員)   2019-05-27 22:46:00
不是阿 萬用模型 本然就是指 你可以用那個架構重train不過短短幾行推文 也難以了解彼此意思 不過直接喊外行也是太偏激了點就是
作者: transforman   2019-05-27 23:05:00
少加了點字,在台灣報酬率低
作者: w60904max (自宅警備隊員)   2019-05-27 23:09:00
NLP會說通用解是指應用情境 很難差異化 資料大者通吃翻譯 購物推薦 ASR 都可以看出誰是領先者然後換個語言和情境 多一種排列組合不然想聽聽DrTech 對GPT2在寫文章上的領先有什麼高見
作者: DrTech (竹科管理處網軍研發人員)   2019-05-27 23:50:00
抱歉,短短推文的確有誤解。感謝你後來的說明,看懂了。
作者: Arnol (還是太淺了)   2019-05-28 09:19:00
我只會PLP
作者: acelp (未來,一直來一直來)   2019-05-28 09:36:00
澄清是誤會就好 台灣這塊真的落後不少 學界當初也做得不夠深入 甚至都轉組 現在潮流一變遷就只能找海歸了
作者: chengcti (版主請投我一票!)   2019-05-28 11:04:00
你知道直銷 最愛用NLP
作者: eatpupu (吃大便)   2019-05-28 11:08:00
NLP 本來就是坑,語言是被人類定義出來的東西
作者: chienk (.................)   2019-05-28 17:00:00
不是國外風風火火的東西 都適合拿回來台灣做 台灣需要認清處自己在世界產業中間的位置

Links booklink

Contact Us: admin [ a t ] ucptt.com