微軟周一在Build 2018開會者大會上展示以電腦視覺、聲音辨識及AI技術(shù)為基礎(chǔ)的未來會議系統(tǒng)原型,可以追蹤辨識所有與會者,并錄制會議中所有聲音。
這套原型系統(tǒng)包含360度環(huán)景攝影機(jī)及麥克風(fēng)陣列,它的相機(jī)具備臉部辨識功能,可在與會者走進(jìn)會議室時(shí)偵測并歡迎他們。會議進(jìn)行時(shí),該系統(tǒng)可錄下所有人聲音。最後,不論他們使用何種語言,這套人工智慧系統(tǒng)還能執(zhí)行即時(shí)聽寫(real-time transcription),在會議進(jìn)行同時(shí)將聲音轉(zhuǎn)為文字。這使得即使是聽力有障礙的與會者,也能理解其他人的談話內(nèi)容。
這套AI會議系統(tǒng)可在會議進(jìn)行時(shí)辨識與會人員,并進(jìn)行即時(shí)聽寫,紀(jì)錄每個(gè)人所說的話。
目前尚不知這套未來會議系統(tǒng)的詳細(xì)技術(shù),但可能整合微軟現(xiàn)有技術(shù),包括Skype、Cortana的通話及翻譯技術(shù)。也可能結(jié)合微軟挑戰(zhàn)Slack的Microsoft Teams,以便在會議中有人提及「我會在下周再聯(lián)系你」時(shí),系統(tǒng)透過Microsoft Teams發(fā)出通知給相關(guān)人士。
此外,Office 365及預(yù)計(jì)今年上半展示的第二代會議系統(tǒng)Surface Hub也可能整合這套AI系統(tǒng)。