近日,中國科學技術(shù)協(xié)會正式公布《關(guān)于2021“科創(chuàng)中國”榜單遴選結(jié)果的公示》,聲智科技完成的“遠場聲學信息人機交互關(guān)鍵技術(shù)”榜上有名。
聲智科技研發(fā)團隊自2020年開始聯(lián)合攻關(guān)新一代人工智能技術(shù)。
此次攻堅的多技能多模態(tài)感知AI技術(shù)方向,融合了基于經(jīng)典陣列信號處理的模型驅(qū)動算法,以及基于深度學習的數(shù)據(jù)驅(qū)動算法,突破了在遠距離、復雜的聲學場景下,語音交互的聲學感知和語義理解方面帶來的瓶頸問題。
幾十年來,語音識別技術(shù)的研發(fā)和應用難點,存在環(huán)境噪聲、人聲、房間混響的干擾,常規(guī)的語音處理方法導致信號失真和資源消耗大,使得語音識別技術(shù)準確率低,應用困難。
針對以上需求及難點,聲智以自主知識產(chǎn)權(quán)的回聲抵消、噪聲消除、聲源定位、語音識別、自然語言理解為核心技術(shù),以多租戶網(wǎng)絡(luò)架構(gòu)為載體,面向所有智能產(chǎn)品,研發(fā)出了一套端+云結(jié)構(gòu)的人機交互系統(tǒng)。
這套技術(shù)和系統(tǒng)的落地,具有高度可擴展的架構(gòu),可適配各種形狀、各種計算能力的智能產(chǎn)品,極大地提高了智能設(shè)備的可操控性,提升了用戶體驗,推動了更多智能產(chǎn)品的落地。
聲智科技Azero人工智能開發(fā)框架
此次獲獎是一個嶄新的起點,未來,聲智科技還將持續(xù)探索領(lǐng)域前沿,積累核心技術(shù)以及落地應用,助力各行各業(yè)創(chuàng)新發(fā)展、智能化轉(zhuǎn)型升級,為我國人工智能的發(fā)展持續(xù)注入活力。