OCR識別接口需要具備哪些核心技術(shù)

發(fā)表時間：2021-10-15 14:01

　　圖片壓縮算法

　　平臺在接入OCR識別接口時，會要求把需要識別的圖片上傳，但如果原圖上傳質(zhì)量過高的圖片，會對服務(wù)器造成很大的負(fù)擔(dān)，圖片壓縮算法可以將大體積的圖片壓縮成合適的尺寸，同時還不會影響識別的清晰度，既減輕了服務(wù)器成本又提高了上傳速度。

　　波浪紋消除

　　部分用戶在使用ocr識別過程中，會上傳用手機拍攝的圖片，這類圖片上通常會出現(xiàn)一串串波浪紋，看起來不太影響圖片的質(zhì)量，但對OCR識別造成了一定的干擾，這就要求在OCR技術(shù)開發(fā)過程中，需要考慮能消除此類波浪紋的算法，提升OCR識別的精準(zhǔn)性。

　　無效背景要素消除

　　識別目標(biāo)圖片過程中，會遇到各種各樣雜亂無章的背景，這些會和主體內(nèi)容融合在一起，干擾OCR的精準(zhǔn)識別，比如掃描圖書，就會受到背面文字印跡的干涉，還有被識別圖片存在臟污、破壞、不完整等情況，這些都是需要ocr識別技術(shù)能消除雜亂背景，完成精準(zhǔn)識別。

　　自動分段和選區(qū)

　　假如設(shè)別目標(biāo)是一張報紙后者圖片，那么會遇到兩個問題，一個是每篇文章都會有很多段落，但OCR一般都是一行行的識別返回內(nèi)容，這就需要ocr能夠?qū)崿F(xiàn)自動分段排版的技術(shù)，方便后續(xù)工作人員的錄入編輯工作;另一個是報紙每個版面都會有各種各樣的排版，不同的文章都是小方塊的形式展現(xiàn)，這就需要ocr能夠?qū)崿F(xiàn)自動選區(qū)功能，把需要識別的文章小方塊單獨識別出來。

上一篇俄政府提交在公共場所使用健康二維碼法案

下一篇讓您了解NFC功能的實際用途

分享到：

^{<pre id="uxo4p"></pre>}