微軟聯(lián)手國(guó)內(nèi)創(chuàng)業(yè)公司ROBOO開發(fā)AI會(huì)議系統(tǒng)
趙陳婷
5月初的微軟Build 2018大會(huì)上,一家中國(guó)初創(chuàng)公司與小米、華為、大疆一起,作為中國(guó)企業(yè)代表出現(xiàn)在微軟CEO納德拉的演講環(huán)節(jié)。
納德拉當(dāng)時(shí)展示的是微軟至今在AI領(lǐng)域提供的第一個(gè)開發(fā)者硬件平臺(tái)——多MIC語(yǔ)音開發(fā)板MSDDK(Microsoft Speech Device SDK),這是一個(gè)面向遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別的軟硬一體方案。
隨后,微軟還向外界展示了一款令人驚奇的用于多人會(huì)議的設(shè)備,可以同時(shí)記錄多人會(huì)議的語(yǔ)音和圖像,對(duì)不同人的發(fā)言進(jìn)行標(biāo)記和語(yǔ)音轉(zhuǎn)寫,還分開歸檔提取會(huì)議重點(diǎn)議題或摘要。
要知道當(dāng)前的AI巨頭,包括Amazon,Google等推出的類似產(chǎn)品都是面向C端的消費(fèi)者,而微軟的產(chǎn)品一推出就是面向具有更高準(zhǔn)入門檻的商用市場(chǎng)。
剛結(jié)束的2018微軟人工智能大會(huì)(Microsoft AI Innovate)上,微軟Build大會(huì)上的上演的“黑科技”——全球首創(chuàng)AI會(huì)議系統(tǒng)再次被演示。
而這個(gè)被微軟全球技術(shù)院士黃學(xué)東形容為“黑塔”的產(chǎn)品其實(shí)是由中國(guó)的AI公司ROOBO和微軟合作開發(fā)的。
從技術(shù)上來(lái)講,這款產(chǎn)品的應(yīng)用解決了幾個(gè)AI領(lǐng)域的關(guān)鍵性技術(shù),比如多人對(duì)話場(chǎng)景下的噪音處理,多人對(duì)話場(chǎng)景下的說(shuō)話人語(yǔ)音分離及語(yǔ)音技術(shù)與圖像技術(shù)的同步應(yīng)用。
黃學(xué)東在接受第一財(cái)經(jīng)記者采訪時(shí)表示,上述產(chǎn)品真正的微軟“全武功”黑科技。“這是人工智能用聽覺和視覺對(duì)《封神演義》里‘耳聽八方、眼觀六路’完整的寫照。”
作為技術(shù)提供方之一,ROOBO CTO雷宇表示,這款產(chǎn)品是由微軟和ROOBO合作,深度挖掘DDK開發(fā)板的技術(shù)潛力而來(lái)。
作為技術(shù)提供方之一,ROOBO CTO雷宇表示,這款產(chǎn)品是由微軟和ROOBO合作,深度挖掘DDK開發(fā)板的技術(shù)潛力而來(lái)。
“其中,ROOBO完成MSDDK在音頻,聲學(xué)及硬件的設(shè)計(jì)與實(shí)現(xiàn),并且由ROOBO直接向開發(fā)者提供硬件,而微軟提供Speech Service開發(fā)平臺(tái)。配合Azure提供的認(rèn)知服務(wù),提供多種語(yǔ)言和知識(shí)技能,可以廣泛應(yīng)用于智慧家電,機(jī)器人,智能音響,機(jī)頂盒等多種場(chǎng)景。”雷宇解釋道。
除了與微軟聯(lián)合研發(fā)的認(rèn)知服務(wù)開發(fā)者套件和智能會(huì)議系統(tǒng),雷宇還在2018微軟人工智能大會(huì)上介紹了ROS.AI人工智能系統(tǒng),并向在場(chǎng)觀眾展示了ROOBO旗下兒童智能機(jī)器人產(chǎn)品——布丁豆豆。
公開信息顯示,ROOBO是一家智能硬件科技平臺(tái)類公司,提供人工智能解決方案。
據(jù)ROOBO董事長(zhǎng)熊明華介紹,ROOBO還將在人工智能其它領(lǐng)域和微軟深度合作,為用戶和開發(fā)者提供新的AI賦能產(chǎn)品和方案。
此外,ROOBO也是國(guó)際語(yǔ)音識(shí)別巨頭Nuance在AI解決方案上的戰(zhàn)略合作伙伴,和Nuance在智慧家庭,兒童教育,車載等領(lǐng)域也有合作。