捷通華聲OCR核心引擎是針對(duì)特定語言的識(shí)別軟件模塊,該軟件模塊是整個(gè)軟件的核心模塊。核心模塊接收其他模塊的設(shè)置,并根據(jù)設(shè)置內(nèi)容對(duì)文字圖片數(shù)據(jù)進(jìn)行識(shí)別,并將識(shí)別結(jié)果列表返回給調(diào)用模塊。
捷通華聲OCR圖像識(shí)別技術(shù)具有以下特點(diǎn):
- 支持多國文字識(shí)別:支持中文簡(jiǎn)繁體、純英文識(shí)別,識(shí)別率達(dá)到99%以上。
- 支持多種識(shí)別方式:支持掃描識(shí)別和拍照識(shí)別。
- 支持多圖像格式:支持TIFF、BMP、PNG、GIF、JPEG格式圖像的讀取,支持黑白、灰度、彩色圖像的處理;
- 支持自動(dòng)版面分析:能自動(dòng)分析出橫排文本、豎排文本、表格和圖像等區(qū)域,并對(duì)文本和表格區(qū)域的文字進(jìn)行識(shí)別。針對(duì)特殊應(yīng)用(例如名片識(shí)別)有專門優(yōu)化的版面分析算法;
- 支持手動(dòng)版本分析:支持對(duì)用戶指定區(qū)域的文字圖像進(jìn)行識(shí)別;
- 傾斜校正功能:可以對(duì)圖像由于掃描引起的傾斜進(jìn)行自動(dòng)校正;
- 畸變校正功能:可以對(duì)由于非統(tǒng)一照度和近距拍攝造成的灰度畸變和幾何畸變進(jìn)行自動(dòng)校正;
- 識(shí)別字體多樣:支持多語種、多字體、多字號(hào)識(shí)別;
- 多種字符集輸出:支持GB2312、BIG5、GBK、Unicode、UTF-8等內(nèi)碼的輸出;
- 可獲取識(shí)別結(jié)果詳細(xì)信息:能夠獲取識(shí)別文字在原文中的信息,包含文字在圖像中的坐標(biāo)、字體、字號(hào)、可信度和候選字。