首頁>>廠商>>語音識別與合成>>Nuance

發(fā)表評論分享按鈕

Nuance CTO:語音技術將成為移動技術

2011/08/25

  語音技術和操作系統(tǒng)和硬件正在進行深度整合,并有望改變智能手機。前不久有人發(fā)現(xiàn)iOS5中內(nèi)置了Nuance的語音識別技術:在輸入文字時,鍵盤的空格鍵左側(cè)會有一個話筒的圖標,點擊一下會出現(xiàn)一個語音輸入頁面,當你說話時這個頁面會一直保留,你停下來,這個頁面也會自動切換回鍵盤頁面。

  為iOS5提供語音技術的Nuance公司CTO最近分享了他對語音技術的看法。他認為語音正在從一種文本備選方案轉(zhuǎn)變成一個更加強大的工具,能理解用戶意圖,通過自然語言處理、語義分析和云計算等技術幫助用戶迅速獲得信息。本質(zhì)上語音正在成為移動設備的智能快捷方式。

  有些用戶界面也可幫你找到那些你所熟悉但很難啟動或找到的應用程序或信息,語音可以完善和提升這些界面。語音能幫你找到它們,能提供非常強大的直接訪問,我們正在進入一個激動人心的語音時代。

  Nuance的Dragon Go應用可讓你通過語音完成搜索,并且打開的不是搜索結(jié)果頁面,而是相關的網(wǎng)站或應用,讓你更快地完成搜索。


  但語音技術的絕活兒在于允許用戶查詢非結(jié)構化數(shù)據(jù),并迅速獲得答案。Nuance幫助IBM開發(fā)的Watson項目采用了IBM的深度問題解答、自然語言處理、機器學習等技術,可手機用戶迅速找到以前很難找到的東西。比如,你可以詢問好友對某家餐館的看法,該技術可以通過你的好友的社交網(wǎng)站信息告訴你答案。

  Sejnoha稱把語音技術深度整合到智能手機中更有意義,這將對用戶體驗有很大提升。手機制造商非常愿意讓語音技術整合成為一道分水嶺,讓自己的硬件脫穎而出。他認為語音是一種新的控制方式,就好比是虛擬框架上的自然語言疊加層。人們可以通過語音更加快捷方便地獲得和控制手機里的東西。

36氪