[問題] 怎麼挑選 4096 個韓文字

作者: HuangJC (吹笛牧童)   2014-09-13 03:58:36
怎麼挑選 4096 個韓文字
看大家都在分享感情,我就分享一下阿宅工程師在做什麼好了
C 語言,或任何語言,其實都是工具
而在工具之上還有 domain knowledge, 這其實更重要
比如會計,我不懂,無法寫會計程式
下棋,我不會贏,無法寫下棋程式
而如果有 domain knowledge,就算工具語言不熟練
for loop 不用卻 hard code 幾百行,或程式速度略慢,甚至當機
這些其實在某限度下都可以忍受的
(還是有不少手機會自動重開機啊,那就是當機了;人家還不是在賣)
因此,阿宅的工作,決勝點不在 coding, 在 domain knowledge
換個領域常就要 K書了
(就好像會打電話了,但換個妹就得重新熟悉對方的喜好;相對之下打電話只是最基本的)
這次為什麼要挑 4096 個韓文字?
因為同事在寫小設備的軟體,記憶體有限,他提出的上限就是 4096 字
我們可以手機顯示簡訊來理解
手機之所以可以顯示簡訊,是因為從大氣中接到簡訊的內碼,而內碼再查詢出字型
這張字型表大,則字的選擇多;若記憶體不足,則能選擇的字體少(收到只好顯示亂碼)
以中文來說,怕不有數萬字;但若記憶體不足,則挑一萬多字的次常用字
再不足,可以精簡至數千字的常用字
以英文來說,是拼音字,那只要 26 個;或分大小寫,則 26*2 個
那麼韓文呢?韓文算怎樣的類型,怎樣挑比較好呢?
韓文字母才 24 個,如果都用字母,就 24 字即可
就好像中文雖然數萬字,但如果全用注音文,也只要幾十字即可
如果我們真的只提供韓文字母 24 字,那是注音文了
那要怎麼挑 4096 字以下呢?
然後我就在一堆文件中頭大了..
(當然啦,我都舉手機為例了;有做韓文手機的工程師應該有答案)
作者: ahsan (臭屁阿三)   2014-09-13 04:11:00
咦,不算漢字,韓文本就是注音文,基本格局就是子音母音子音組沒記錯的話,通通能發音,有意思的字不就幾千個嘛.ISO 應該有CJK 碼表可查.我玩 national languages 是 80 年代了,也許又是給你舊情報.
作者: HuangJC (吹笛牧童)   2014-09-13 04:48:00
CJKV 是含其它語系,我很快決定日越中文都不需要了所以現在字集縮小到 K0 這個來源..
作者: ahsan (臭屁阿三)   2014-09-14 04:13:00
http://www.unicode.org/charts/PDF/UAC00.pdf自己去算,這些是Hangul(韓文),但是你還會需要Jamo(字母).
作者: HuangJC (吹笛牧童)   2014-09-16 02:28:00
我做了個減法,光 AC00~D7A3就一萬多字,又爆了直接講完我的做法好了, KS X 1001 內有常用諺文所以我把這份文件和諺文取交集,就是常用諺文了接下來我還有好多語系要做,麻煩的是文件沒一致性每個國家都要重檢討一次,才能定義出常用字所以我覺得,我仍然沒拿到釣竿

Links booklink

Contact Us: admin [ a t ] ucptt.com