據(jù)了解,該獎項是全球語音領域頂級會議interspeech2021的特別競賽,由牛津大學、麻省理工學院林肯實驗室、斯坦福語音技術研究實驗室、韓國Naver等全球頂尖高校和學術機構聯(lián)合舉辦。此次競賽高手云集,包括美國約翰霍普金斯大學、微軟研究院、思必馳、字節(jié)跳動、國音智能、搜狗、美團等國內外一流高校、研究機構及企業(yè)。
聲紋識別是指通過人工智能技術識別兩段語音是否為同一人。目前聲紋識別廣泛應用在金融質檢、安防、刑偵等領域,關系到用戶隱私和安全問題。在應用的過程中,聲紋識別跨域問題、復雜音頻環(huán)境問題為各行各業(yè)提出了嚴峻的挑戰(zhàn)。如何在應用中,有效降低跨域對聲紋識別的干擾、提升聲紋識別在復雜音頻環(huán)境下的識別準確性能,成為了整個行業(yè)共同關心的課題。
本次競賽中,中關村科金使用基于深度學習的聲紋識別技術,參加Trick1和Trick2兩個賽道的比賽。兩賽道均為文本無關聲紋識別任務。其中,Trick1采用指定的Voxceleb2dev作為訓練集,Track2則可使用測試集之外任何開放數(shù)據(jù)作為訓練集。比賽最大挑戰(zhàn)是需要進行跨語言及復雜環(huán)境下的聲紋識別。中關村科金通過探索新的數(shù)據(jù)增廣方案,改進聲紋識別算法,優(yōu)化訓練損失函數(shù),并融合多個SOTA(行業(yè)領先)模型,顯著提升了聲紋識別在跨語言和復雜環(huán)境的魯棒性以及識別準確率,從而獲得兩個賽道的亞軍。
作為國內領先的人工智能科技公司,中關村科金長期在聲紋識別技術領域進行研發(fā)投入,基于海量預訓練模型以及AI算法助力,在聲紋識別公開數(shù)據(jù)評測中,識別準確率超過99.7%,廣泛應用于客服、催收、投訴等場景,為保護用戶隱私和數(shù)據(jù)安全、保障數(shù)字經濟健康發(fā)展提供先進的科技力量支撐。
依托強大的AI算法能力和聲紋識別技術,中關村科金助力銀行、保險、證券、信托、教育、醫(yī)療、智能制造等行業(yè)客戶實現(xiàn)安全、高效的數(shù)字化升級。目前,已為數(shù)百家知名行業(yè)機構、企業(yè)合作提供智能化轉型解決方案,在服務企業(yè)數(shù)字化轉型、實現(xiàn)低碳綠色發(fā)展方面處于行業(yè)領先地位。