公司有一個OCR 專案是以Google Vision API 認字然後用Regex 處理
以前API 回傳的字都有順序,如下圖
http://i.imgur.com/ThAIHlL.jpg
清單左邊的項目對應其數量
回傳結果就是項目後方數字就是它的數量,要找到其正確數量用regex 輕易辦到,成功率也有70~80%
可是一個禮拜前突然跌到20%,排查結論就是Vision API 回傳的順序不一樣了
如下圖
http://i.imgur.com/mYgZkte.jpg
項目和數字分兩組上下分組一堆,而且各自的順序還不一樣,用Regex 已經不可能做到了,最後決定重寫改以座標找數字
有用Vision API 的前輩最近有發現甚麼異樣嗎?