OCR識別接口需要具備哪些核心技術(shù)發(fā)表時間:2021-10-15 14:01 圖片壓縮算法 平臺在接入OCR識別接口時,會要求把需要識別的圖片上傳,但如果原圖上傳質(zhì)量過高的圖片,會對服務(wù)器造成很大的負(fù)擔(dān),圖片壓縮算法可以將大體積的圖片壓縮成合適的尺寸,同時還不會影響識別的清晰度,既減輕了服務(wù)器成本又提高了上傳速度。 波浪紋消除 部分用戶在使用ocr識別過程中,會上傳用手機拍攝的圖片,這類圖片上通常會出現(xiàn)一串串波浪紋,看起來不太影響圖片的質(zhì)量,但對OCR識別造成了一定的干擾,這就要求在OCR技術(shù)開發(fā)過程中,需要考慮能消除此類波浪紋的算法,提升OCR識別的精準(zhǔn)性。 無效背景要素消除 識別目標(biāo)圖片過程中,會遇到各種各樣雜亂無章的背景,這些會和主體內(nèi)容融合在一起,干擾OCR的精準(zhǔn)識別,比如掃描圖書,就會受到背面文字印跡的干涉,還有被識別圖片存在臟污、破壞、不完整等情況,這些都是需要ocr識別技術(shù)能消除雜亂背景,完成精準(zhǔn)識別。 自動分段和選區(qū) 假如設(shè)別目標(biāo)是一張報紙后者圖片,那么會遇到兩個問題,一個是每篇文章都會有很多段落,但OCR一般都是一行行的識別返回內(nèi)容,這就需要ocr能夠?qū)崿F(xiàn)自動分段排版的技術(shù),方便后續(xù)工作人員的錄入編輯工作;另一個是報紙每個版面都會有各種各樣的排版,不同的文章都是小方塊的形式展現(xiàn),這就需要ocr能夠?qū)崿F(xiàn)自動選區(qū)功能,把需要識別的文章小方塊單獨識別出來。 |