看到版友們對 Unicode Ext A/B/C/D 等漢字進行編碼,
我覺得相當感激也相當佩服。
但不知道行易公司還沒有投入資源在這方面的工作?
畢竟出於版本統一和專利權及著作權的考量等等,
由官方制訂一份標準碼表似乎是比較適合的,
如果官方資源不足,或許也可以跟網路上熱心的使用者們合作,
使用者來編碼,官方進行公佈並提供其他使用者糾錯,
最後再由官方作最後仲裁並公佈標準標碼?
關於嘸蝦米的碼表,我覺得有幾點可考慮改進的地方,
一、對 Unicode Ext A/B/C/D 等擴充提供標準編碼
二、由於字集擴充,有一些以前定義不清楚的字根應該要釐清,
以前訂的字根有可能不夠用,需要擴充,
例如:「卝」到底要不要加訂為「R」?
三、標準碼表不要放進太多容錯碼,以免造成混亂和重碼率的提高,
我個人偏好倉頡那樣的方式,繁簡相對字寫法不同,拆法就不同,
最好只根據相容於中日台韓各地區的標準寫法來編碼,
容錯碼只在字根相近容易辨識錯誤時採用。
四、有些碼漏編了,例如:「啇」應該要有「XO」的拆法。
五、簡中模式時,不完全是照簡體寫法來拆碼的,
例如:「馬」的簡體拆法被訂為「MFA」,
但實際寫法卻應該是「MEE」。
六、目前碼表中有許多「暗藏字根」的存在,
一樣造成碼表的混亂和重碼率的提高,
例如:「牙 = Y」、「為 = W」、「輕的右上 ES 部分 = S」、
「犮去掉一點 = X」、「對的左半邊 = F」、
「会去掉上面的 A = D」等,
甚至有「胡 = FU」,「加上偏旁的喿 = LT」。
這些暗藏規則下的編碼,要不就應該去除,
要不就應該制訂公開的規則,一併採用。
七、老生常談的一碼字二碼字重訂問題,
我個人覺得一碼字放了一堆數字確實浪費,
數字之外的一碼字也有一些其實不足以放到一碼字的。
二碼字要考量字頻和好記,最好都是頭碼加尾碼為主,
已被佔用則可考慮採用頭尾加 V 。
個人覺得次常用字打三碼尚可接受,
一個字要打四碼的話,不知道是不是因為我習慣快打模式的關係,
總是會覺得怪怪的。 XD
※ 編輯: blueantares 來自: 220.132.124.68 (01/30 13:37)
※ 編輯: blueantares 來自: 220.132.124.68 (01/30 14:02)