秉持創(chuàng)新引領、數據賦能和服務高效的理念,國內某省攜手捷通華聲,打造省級智能會議系統(tǒng),為各市、縣區(qū)黨委、政府、政協(xié)提供實時語音轉錄、投屏、雙語互譯、會議記錄管理等一系列服務,助力政府提升辦公效能。
語音識別是智能會議系統(tǒng)的核心技術,除核心算法還需要豐富的語料訓練,綜合能力直接影響轉寫速率以及對方言口音、行業(yè)術語、敏感詞等內容的轉寫成功率,是部署省級會議系統(tǒng)的關鍵指標。
捷通華聲在近20年的人工智能技術研發(fā)與產業(yè)化應用過程中,語音識別技術持續(xù)保持行業(yè)領先,同時積累了定制化服務經驗。
在聲學模型方面,通過采集大量真實錄音數據,對不同方言、語種發(fā)音習慣,如兒化音、聲調等,進行學習訓練,提高模型精度和識別率。
在語言模型方面,對各地方言、語種的特有詞匯進行專門訓練,有效提升了語音識別引擎對口音、詞匯的適配能力。
實際會議場景中,無論發(fā)言人說的是普通話還是地方方言,靈云智能會議系統(tǒng)都能對這些發(fā)言分角色進行精準識別轉寫,快速生成會議紀要。
而且基于最新的神經網絡算法,系統(tǒng)能夠對各地區(qū)、各場景的語音進行不斷地學習與適應,增強口音、語速適配能力,持續(xù)提升多人對講、遠場講話等場景中的語音識別率。
針對會議交流過程中,普遍存在的“嗯”“啊”“是吧”等大量助詞,靈云智能會議系統(tǒng)專門提供了語氣詞過濾功能,確保輸出的會議紀要更符合文字版要求。
投屏是政府會議普遍會使用的功能,通過大屏將領導講話實時展示出來,方便所有與會成員準確獲取會議信息,特別是對方言差異比較大的情況。
除了會場實時語音轉寫,靈云智能會議系統(tǒng)也支持錄音離線轉寫,方便書記員整理領導外出講話。此外,會議紀律、會議公告等內容,也可用系統(tǒng)的語音合成功能播報,為管理人員提供全方位的會議工具。
關于會議保密性,靈云智能會議系統(tǒng)采用私有云的方式進行部署,并提供完整的軟硬件環(huán)境。數據信息完全保存在企業(yè)內部,外界無法收集和查看,做到在物理上管理可控,在軟件上確保數據信息的私密性與安全性。