極限元專門從事智能語音技術(shù),擁有完全自主知識(shí)產(chǎn)權(quán)。其語音合成采用世界先進(jìn)的數(shù)據(jù)驅(qū)動(dòng)技術(shù),利用精心設(shè)計(jì)的語音語料庫進(jìn)行聲學(xué)模型和文本處理模型的訓(xùn)練,得到的模型深度挖掘了語音語言特性,從而能夠合成接近真人發(fā)音的語音,合成的語音清晰、自然、親切、具有高表現(xiàn)力。
韻律是合成語音是否具有高自然度的關(guān)鍵所在。極限元語音合成對(duì)輸入文本進(jìn)行韻律分析預(yù)測(cè),其中包括韻律詞、韻律短語邊界劃分,詞重音的分布,各個(gè)語音單元的基頻、時(shí)長(zhǎng)等。這樣合成的語音清晰明朗,親切自然,接近真人發(fā)音。目前,極限元已為百度、騰訊、搜狗、奇虎360等眾多客戶服務(wù),建立了長(zhǎng)期穩(wěn)定的合作關(guān)系。
極限元語音合成技術(shù),合成語音效果媲美真人發(fā)聲,專業(yè)MOS分可達(dá)4.0,為了市場(chǎng)發(fā)展需要,極限元的語音合成技術(shù)全面支持多方言、多語種、多音色的選擇,目前標(biāo)配的有甜美女生和渾厚男生,針對(duì)用戶的不同應(yīng)用場(chǎng)景和個(gè)性化的音色需求,提供全方位的語音合成定制化服務(wù),例如:明星的聲音、兒童的聲音以及某個(gè)地區(qū)方言。
極限元語音合成定制化支持錄音人選型、錄音采集、語料標(biāo)注,還能實(shí)現(xiàn)模型迭代訓(xùn)練、合成引擎優(yōu)化,支持在線、離線模式,適用于多種平臺(tái),可應(yīng)用于多個(gè)領(lǐng)域。如:
呼叫中心行業(yè)中的應(yīng)用
擁有大量客戶群體的行業(yè)呼叫中心,如電信、銀行、證券、保險(xiǎn)、房地產(chǎn)、家電、運(yùn)輸、互聯(lián)網(wǎng)、公共服務(wù)機(jī)構(gòu),語音合成技術(shù)能夠以有限的資源占用,將文字信息轉(zhuǎn)化成連續(xù)語音,合成語音自然、流暢。對(duì)于呼叫中心而言,無需對(duì)大量的信息進(jìn)行錄音,極大地節(jié)省了工作量和存儲(chǔ)空間,同時(shí)根據(jù)呼叫中心需求,語音合成技術(shù)還能提供個(gè)性化語音合成服務(wù),為呼叫中心提供高質(zhì)量的服務(wù)需求。
車載導(dǎo)航上的應(yīng)用
智能化、人性化的車載導(dǎo)航已經(jīng)成為一個(gè)重要的發(fā)展趨勢(shì),車載導(dǎo)航產(chǎn)品中的語音輸出用合成技術(shù)將需要同用戶交互的信息轉(zhuǎn)化成語音,如:道路信息,駕駛導(dǎo)航信息,POI信息,實(shí)時(shí)路況等,使用戶通過語音獲取信息,方便駕駛員解放雙手和眼睛,同時(shí)提高駕駛安全性。
智能機(jī)器人的應(yīng)用
銀行、醫(yī)院、教育等行業(yè)的商用機(jī)器人逐漸成熟,極限元語音合成可以為機(jī)器人合成個(gè)性化語音,比如銀行、醫(yī)院的機(jī)器人語音需要甜美親切的,而教育行業(yè)主要針對(duì)孩子的,機(jī)器人的語音需要呆萌可愛的童音。
智能家居的應(yīng)用
在家居場(chǎng)景中,主要圍繞著智能電視、智能音箱展開,解決用戶需求,如搜索影片、歌曲、簡(jiǎn)單交互、應(yīng)用調(diào)取等,極限元語音合成定制化能夠根據(jù)用戶需求,定制合成語音,如明星的聲音。
極限元語音合成已達(dá)到流暢、連貫、自然、逼近真人發(fā)聲的語音合成效果,無論是地圖導(dǎo)航、機(jī)場(chǎng)廣播的甜美女生,新聞朗讀的渾厚男生,還是機(jī)器人的可愛童聲,極限元的語音合成技術(shù)能夠滿足企業(yè)需求,實(shí)現(xiàn)個(gè)性化高端定制,讓大家聽到機(jī)器的聲音娓娓動(dòng)聽,讓未來交互場(chǎng)景更加豐富、個(gè)性化。