[請問] 如何分辦文字檔哪些是ansi碼哪些是utf8碼

作者: alphard (阿阿)   2015-06-22 22:47:15
目前需將某資料夾的所有文字檔約4百多個合併成一個文字檔
所以在cmd下指令type *.txt >> test
結果發現產生的檔案會有部份亂碼,
原因是資料夾裡某些txt檔是用ansi編碼,而非UTF-8編碼
由於在資料夾裡都只顯示txt,不知道哪個是ansi編碼,哪個是UTF-8編碼。
若用手動一一打開檔案,再把ansi編碼的檔案改存UTF-8,實在太費工了。
另外有試著用ConvertZ批次轉檔,惟ConvertZ只接受全部為ansi檔才可批次轉。
所以有何方法或工具可辦別資料夾裡的txt檔,哪些ansi編碼,哪些為UTF-8編碼?
使我能把這些ansi編碼的文件挑出來,再餵給ConvertZ批次轉檔。
嘗試了一個晚上+Googl爬文無解,只好問板上的強者了,
感謝!
作者: dearlove (初現)   2015-06-22 22:52:00
您對utf-8的似乎有誤解 而且cmd本來就不是utf-8編碼所以顯示不出來很正常...
作者: alphard (阿阿)   2015-06-22 23:11:00
不會耶。在cmd底下打type *.txt >> test原先是UTF-8編碼的檔案不會有問題,而是原先ansi編碼的檔案,在匯入test檔中,都變成亂碼了@@
作者: kyrc (橘子)   2015-06-23 00:11:00
指文通試試 http://hokoy.net/MyApps/Zitong.aspx最後先備分再試,注意事項有特別列出來無法恢復
作者: mybaby520 (麥卑鄙)   2015-06-23 12:01:00
搜尋txt列出全部文字檔 拖曳到14.6版以上的Emeditor中Ctrl+F搜尋 規則運算式打勾 搜尋群組中所有文檔打勾搜尋\w 按全部抽出 會把非空行的內容全部整併到新文件
作者: alphard (阿阿)   2015-06-23 20:28:00
樓上大大的方法是可行的,但缺點是有文字檔裡有些留白的空行都不見了,可否有保留它們的方法。
作者: mybaby520 (麥卑鄙)   2015-06-24 09:42:00
改搜尋\r
作者: alphard (阿阿)   2015-06-24 22:18:00
再次感謝樓上。另外我發現EmEditor有個功能,把所有目前開啟的檔案,"用指定編碼全部儲存",這樣便可把所有檔案改成UTF-8了。非常方便。
作者: mybaby520 (麥卑鄙)   2015-06-25 09:31:00
咦原來有這功能阿XD 也感謝原PO
作者: oversky0 (oversky0)   2015-06-27 13:33:00
http://totalcmd.net/plugring/EncInfo.htmltotalcmd 加這 plug-in 就可以了。

Links booklink

Contact Us: admin [ a t ] ucptt.com