捷通華聲OCR核心引擎是針對特定語(yǔ)言的識別軟件模塊,該軟件模塊是整個(gè)軟件的核心模塊。核心模塊接收其他模塊的設置,并根據設置內容對文字圖片數據進(jìn)行識別,并將識別結果列表返回給調用模塊。

捷通華聲OCR圖像識別技術(shù)具有以下特點(diǎn):
- 支持多國文字識別:支持中文簡(jiǎn)繁體、純英文識別,識別率達到99%以上。
- 支持多種識別方式:支持掃描識別和拍照識別。
- 支持多圖像格式:支持TIFF、BMP、PNG、GIF、JPEG格式圖像的讀取,支持黑白、灰度、彩色圖像的處理;
- 支持自動(dòng)版面分析:能自動(dòng)分析出橫排文本、豎排文本、表格和圖像等區域,并對文本和表格區域的文字進(jìn)行識別。針對特殊應用(例如名片識別)有專(zhuān)門(mén)優(yōu)化的版面分析算法;
- 支持手動(dòng)版本分析:支持對用戶(hù)指定區域的文字圖像進(jìn)行識別;
- 傾斜校正功能:可以對圖像由于掃描引起的傾斜進(jìn)行自動(dòng)校正;
- 畸變校正功能:可以對由于非統一照度和近距拍攝造成的灰度畸變和幾何畸變進(jìn)行自動(dòng)校正;
- 識別字體多樣:支持多語(yǔ)種、多字體、多字號識別;
- 多種字符集輸出:支持GB2312、BIG5、GBK、Unicode、UTF-8等內碼的輸出;
- 可獲取識別結果詳細信息:能夠獲取識別文字在原文中的信息,包含文字在圖像中的坐標、字體、字號、可信度和候選字。