※ 引述《OAOb ( 湊あくあの老婆(本物))》之銘言:
: 程式語言之所以都沒有中文
: 就是因為中文會讓電腦根本看不懂
: 不然中文圈十幾億人怎麼會沒人開發中文編譯器
做parser本來就不容易吧 而且說實在的 大部分人都不懂中文語法
我不是資工背景的 但我有看過以下這段話
製造自然語言的 parser 有多難?很多人可能沒有試過。我做過這事。在 Indiana 的時
候,我為了湊足學分,修了一門 NLP 課程,跟幾個同學一起實現了一個英語語法的
parser。它分析出來的語法樹形式,就像上面的那樣。
你可能想不到有多困難,你不僅要深刻理解編程語言的 parser 理論(LL,LR,GLR……
),還得依靠大量的例子和數據,才能解開人類語言裡的各種歧義。我的合作夥伴是專門
研究 NLP 的,把什麼 Haskell,類型系統,category theory,什麼 GLR parsing 之類
…… 都弄得很溜。然而就算如此,我們的英語 parser 也只能處理最簡單的句子,還錯
誤百出,最後矇混過關 :P