靈云HCI核心技術(shù)介紹——光學(xué)字符識別（OCR）

2013-10-17 16:21:29 作者：來源：CTI論壇評論：0 　點(diǎn)擊：

　　OCR（光學(xué)字符識別），是通過圖像處理和模式識別技術(shù)對光學(xué)的字符進(jìn)行識別的意思，是自動識別技術(shù)研究和應(yīng)用領(lǐng)域中的一個重要方面�，F(xiàn)在OCR主要是指文字識別軟件，它是一種能夠?qū)⑽淖肿詣幼R別并錄入的軟件技術(shù)。

　　捷通華聲OCR核心引擎是針對特定語言的識別軟件模塊，該軟件模塊是整個軟件的核心模塊。核心模塊接收其他模塊的設(shè)置，并根據(jù)設(shè)置內(nèi)容對文字圖片數(shù)據(jù)進(jìn)行識別，并將識別結(jié)果列表返回給調(diào)用模塊。

　　捷通華聲OCR圖像識別技術(shù)具有以下特點(diǎn)：

支持多國文字識別：支持中文簡繁體、純英文識別，識別率達(dá)到99%以上。
支持多種識別方式：支持掃描識別和拍照識別。
支持多圖像格式：支持TIFF、BMP、PNG、GIF、JPEG格式圖像的讀取，支持黑白、灰度、彩色圖像的處理；
支持自動版面分析：能自動分析出橫排文本、豎排文本、表格和圖像等區(qū)域，并對文本和表格區(qū)域的文字進(jìn)行識別。針對特殊應(yīng)用（例如名片識別）有專門優(yōu)化的版面分析算法；
支持手動版本分析：支持對用戶指定區(qū)域的文字圖像進(jìn)行識別；
傾斜校正功能：可以對圖像由于掃描引起的傾斜進(jìn)行自動校正；
畸變校正功能：可以對由于非統(tǒng)一照度和近距拍攝造成的灰度畸變和幾何畸變進(jìn)行自動校正；
識別字體多樣：支持多語種、多字體、多字號識別；
多種字符集輸出：支持GB2312、BIG5、GBK、Unicode、UTF-8等內(nèi)碼的輸出；
可獲取識別結(jié)果詳細(xì)信息：能夠獲取識別文字在原文中的信息，包含文字在圖像中的坐標(biāo)、字體、字號、可信度和候選字�！�