[問題] 圖片辨識輸出文字

作者: unknown (ya)   2019-06-06 02:11:46
目前有乘客文件可以掃描成PDF檔案,想透過程式將身份字號轉譯成文字檔,該透過什麼方
法呢?
這方面有想過可能要透過智慧學習方式提高辨識度
作者: CCWck (幹嘛要暱稱)   2019-06-06 10:19:00
找ocr api
作者: wii8898333 (frf228898)   2019-06-06 12:54:00
orc辨識度太低怎麼辦呢
作者: Hsins (翔)   2019-06-06 15:09:00
找足夠的 dataset 自己 train 一個問題就在於你有沒有足夠的 data 給他 train,還有你會不會train…
作者: hsnuyi (羊咩咩~)   2019-06-06 16:51:00
除非辨識率100% 不然到時候你還不是要人工比對一次? 身分證字號可以錯喔?用時新找個工讀抄寫就好 要辨識做啥? 有比較省時便宜又正確?^時薪
作者: wahaha279 (哇哈哈:3)   2019-06-06 17:44:00
想玩機器學習先叫老闆給資料 不然就是做不到
作者: ohcE0 (音回)   2019-06-06 20:27:00
身分證資料多少算是可以錯的? 畢竟有驗證碼欄位資料的話 應該已經算是很好自行產生的了
作者: vi000246 (Vi)   2019-06-06 23:06:00
手寫還是印刷的字?
作者: wii8898333 (frf228898)   2019-06-07 06:37:00
印刷
作者: king22649   2019-06-07 07:17:00
印刷的 tesseract 就行了 畫值不要太低的話
作者: art1 (人,原來不是人)   2019-06-07 16:02:00
買個專業的 OCR 軟體來辨識比較實在一些
作者: MasterChang (我愛ASM)   2019-06-08 00:57:00
印刷的用tesseract去串接就好.....

Links booklink

Contact Us: admin [ a t ] ucptt.com