[問題] google ocr api的辨識問題

作者: be00148 (ThirtyCentimeter)   2022-06-23 14:25:35
一直以來都有使用google cloud vision的api來幫我做圖片辨識
但是最近常會發生 段落亂跳的問題
讓我無法依據過去經驗擷取我要的文字
例如一本書的辨識
過去會一行一行辨識下來
標題
內文
頁碼
但是現在可能會由左至右 的方式
可能變成
標題
頁碼 (因為頁碼在最左邊)
內容
不曉得是不是有什麼參數可以去調整?
還是我必須將圖片的背景改成單一顏色,讓他不會亂區分段落?
感謝
作者: papple23g (逆道者)   2022-06-24 01:02:00
辨識結果有附文字框座標 可以用 相對位置+正則表達式判斷 來決定讀字的順序

Links booklink

Contact Us: admin [ a t ] ucptt.com