常有人戲稱廣東人是羊,因?yàn)樗麄儫o論講什么,似乎都會(huì)用"咩--咩--咩--"作句尾語氣詞:
"有咩搞作?"(有什么做法、計(jì)劃?)
"系度做緊咩呀"(現(xiàn)在在做什么呢?)
"系咩?"(是嗎?)
這些地道的粵語仿佛自帶音效,你即使不精通粵語,看到這幾句話都能像模像樣地說出來。粵語就像一種流傳千年的文化符號(hào),一旦你深入了解粵語,必會(huì)佩服它的古樸有趣、博大精深,承載了廣府文化強(qiáng)烈的情感認(rèn)同。
粵語,又稱廣東話,是中國漢語七大方言之一,全球?qū)⒔?.2億人口使用,在國際影響力和語言的韻味方面,粵語的地位絕對(duì)是重量級(jí)的老大。
隨著AI的飛速發(fā)展,應(yīng)用場(chǎng)景不斷擴(kuò)展,智能語音設(shè)備無處不在,對(duì)于多語種多口音語音識(shí)別的需求也在日漸增加。其中,作為擁有強(qiáng)大號(hào)召力的粵語,已成為眾多人工智能廠商關(guān)注的重點(diǎn)。
雖然粵語語音識(shí)別需求越來越多,但想要實(shí)現(xiàn)精準(zhǔn)的粵語識(shí)別效果,面臨的技術(shù)難度也不小。
粵語有多難?
由于承接著古漢語的許多特點(diǎn),粵語在詞匯、語法、發(fā)音上都和普通話有明顯區(qū)別。
詞匯上,粵語的日常用語富有特色。雖是口語,卻比較"文縐縐":"喜歡"叫做"鐘意","厲害"叫做"犀利","討厭"是"乞人憎",勞駕他人、感謝幫忙,要說"唔該";浾Z的發(fā)音就更難了。由于保留了古漢語、古南越語的特色,以及受外語的影響,相對(duì)于普通話的四聲調(diào),粵語擁有完整的九韻六調(diào),能夠組合出的總音節(jié)數(shù)比普通話還要多。
標(biāo)貝科技粵語語音識(shí)別
對(duì)于AI語音產(chǎn)品來說,想要提高語音識(shí)別的準(zhǔn)確性,就需要大量的優(yōu)質(zhì)語音數(shù)據(jù)作為模型訓(xùn)練支撐。面對(duì)以上問題及粵語語音識(shí)別發(fā)展現(xiàn)狀,標(biāo)貝科技此前已經(jīng)推出一系列粵語語音識(shí)別數(shù)據(jù)集,幫助對(duì)識(shí)別模型進(jìn)行優(yōu)化訓(xùn)練。
近日,標(biāo)貝科技在融合更多語音和文本的數(shù)據(jù)采集,以及高精度的數(shù)據(jù)標(biāo)注基礎(chǔ)上,定制專用語音識(shí)別模型,推出高準(zhǔn)確率的粵語語音識(shí)別服務(wù)。
在聲學(xué)模型方面,通過采集大量真實(shí)的粵語錄音數(shù)據(jù),包括朗讀式、自由交談和命令詞等類型,對(duì)粵語的發(fā)音習(xí)慣、聲調(diào)變化等,進(jìn)行學(xué)習(xí)訓(xùn)練,提高模型精度和識(shí)別率。
語言模型方面,標(biāo)貝科技語音識(shí)別技術(shù)通過對(duì)粵語方言中的特有詞匯,如"咁"、"哋"、"嘅"、"咩呀"、"點(diǎn)睇"等進(jìn)行專門訓(xùn)練,有效提升了語音識(shí)別引擎對(duì)口音、詞匯的適配能力。
立足應(yīng)用場(chǎng)景 助力人機(jī)交互更便捷
在移動(dòng)互聯(lián)網(wǎng)和信息大爆炸時(shí)代,無論是從語言角度還是文化角度,我們都不再離群索居,包括人與人的交流、人與機(jī)器的交流,多語種和方言的交匯互通已經(jīng)無處不在。因而,智能語音識(shí)別技術(shù)成為解決"聽不懂"的有效途徑。
伴隨此次粵語語音識(shí)別能力的上線,當(dāng)前標(biāo)貝科技可以支持中文、英文、粵語三種語言的語音識(shí)別,可以廣泛應(yīng)用于工作、生活、學(xué)習(xí)多種場(chǎng)景。
在商務(wù)會(huì)談中,無論發(fā)言人說的是英文、普通話還是粵語,標(biāo)貝科技語音識(shí)別都能對(duì)這些發(fā)言分角色進(jìn)行識(shí)別,將會(huì)議和訪談的音頻快速生成會(huì)議記錄,后期信息檢索和整理更方便快捷。
在智能客服領(lǐng)域,客服機(jī)器人掌握多個(gè)語種,能提高普通話、英文、方言識(shí)別的準(zhǔn)確率,從而精準(zhǔn)識(shí)別出用戶提出的問題,給予用戶最合適的回答,成為真正"聽得懂,說得出"的智能客服,提升服務(wù)質(zhì)量。
智能家居場(chǎng)景下,精準(zhǔn)高效的語音識(shí)別讓用戶不必再擔(dān)心因?yàn)榭谝魡栴}出現(xiàn)的錯(cuò)輸、漏輸問題,隨心所欲對(duì)各類家居、家電語音助手,以及智能機(jī)器人、智能可穿戴設(shè)備等進(jìn)行語音控制。
同時(shí),面向金融、電商、教育、媒體娛樂等行業(yè),我們也推出行業(yè)領(lǐng)先的語音合成方案,擁有豐富的語音合成音庫,覆蓋中文、英文、中英混讀、小語種、方言等不同語種。客戶可快速選擇合適的音色,也可以根據(jù)業(yè)務(wù)場(chǎng)景需求,定制與產(chǎn)品形象相匹配的合成聲音,助力語音產(chǎn)品快速落地應(yīng)用。
未來,隨著語音交互技術(shù)與智能手機(jī)、平板電腦、智能家居等電子設(shè)備芯片集成的深入發(fā)展,將帶動(dòng)智能語音產(chǎn)業(yè)迎來更加廣闊的發(fā)展空間。標(biāo)貝科技將繼續(xù)加碼研發(fā)投入,加速在垂直行業(yè)進(jìn)行滲透和布局,驅(qū)動(dòng)語音合成、語音識(shí)別技術(shù)繼續(xù)升級(jí)迭代,為消費(fèi)者創(chuàng)造更優(yōu)質(zhì)的交互體驗(yàn)。