[請益] 字編碼問題

作者: m7m123d ( )   2014-06-30 08:15:10
在程式裡用pdftotext的方式將PDF檔轉成UTF-8的txt文字檔
接著抓出txt裡面的一段文字
$_str = '生日:066年11月28日';
$_str = str_replace("生日:", '', $_str);
$_str = str_replace("年" , '', $_str);
$_str = str_replace("月" , '', $_str);
$_str = str_replace("日" , '', $_str);
echo $_str;
Output:066年1128
我手動複製沒被替換過去的「年」做替換,發現可行,
google到是字元代碼不相同的問題,這個狀況第一次遇到,
想問一下版上大家有哪些經驗,想伸個關鍵字,謝謝。
作者: joedenkidd (優質的藍色射手)   2014-06-30 22:54:00
要不要在做replace前,將string再轉一次utf8看看用iconv轉,看這樣有沒有機會解決

Links booklink

Contact Us: admin [ a t ] ucptt.com