[問題] OCR（光學辨識）推薦書籍或函式庫 tonytonyjan PTT批踢踢實業坊

[問題] OCR（光學辨識）推薦書籍或函式庫

作者: tonytonyjan (南洋大兜蟲) 2011-11-02 22:21:14

有鑑於在像 komica 這類的討論版或論壇
回覆時都夾帶圖片，而圖片上常常會有字幕或者是漫畫角色的台詞，笑果十足
但是要蒐集這些東西其實很累，於是我有個 idea：
我打算實做一個 content based image search engine
對圖片上的文字，經過辨識之後做 indexing
如此只要把想要的話輸入進去，就可以找到任何相關動漫或電影台詞的引用圖片
（我 google 老半天發現這世界好像還沒有這樣的搜尋引擎，讓我更想做了）
我有IR背景知識，但對於圖形辨識完全不得其門而入
希望在圖形辨識上有經驗的人可以給我一些指引
我目前試過 tesseract, gocr
不過經過測試我發現他們似乎主力在「文件」，對於卡通圖片中的文字辨識能力薄弱
問題：
1. 對於我的需求，我要找得技術是 OCR 沒錯吧？或者我弄錯關鍵字了？
2. 如果關鍵字確實是 OCR，是否有其他適合辨識圖畫（非文件）的函式庫？
3. 接續 2，有什麼推薦的書籍，可以學習如何實做一個 OCR system 呢？
感激不盡^_^
PS.
這是自娛專案，有興趣參與的人也可來信 XD

作者: kewang (652公車) 2010-01-02 22:55:00

還蠻有趣的，要不要試試MODI這個library，不過要安裝OFFICE

作者: tonytonyjan (南洋大兜蟲) 2010-01-02 23:01:00

但我要跑在 UN*X Server上耶，這樣 MODI 沒問題嗎

作者: hilorrk (Cary) 2010-01-03 01:03:00

關鍵字：字幕辨識/擷取..

繼續閱讀

Fw: [問題] H.264 intra predictioncypher [問題] 中文語音辨識台灣有哪些研究單位？yoco315 [請益] 質數發現規律了，它如何進化電腦的世界？arrow552299 [問題] clustered systems與distributed syste …hans0406 Re: [問題] Agile development 和 Rapid applicati …reader [問題] Agile development 和 Rapid application developmentvity [問題] 請問Labview機率..b9722074 Re: [問題] 怎樣的class diagram才算好呢？jiaan Re: [問題] P=NP是什麼？LPH66 [問題] P=NP是什麼？mabus