首頁>>>技術(shù)>>>cti平臺

語音識別技術(shù)將開啟另一扇大門?

陳一斌 2011/06/03

  語音識別技術(shù)擁有足夠高的評價,但一直以來缺乏足夠的表現(xiàn)。由于無法精確的識別人類語音的表達(dá),使人們在使用語音識別技術(shù)的時候總會遇上各種各樣的錯誤,結(jié)果就是人們無法通過語音直接打電話和寫短信。不過,這一切都有可能改變,關(guān)鍵詞又是蘋果(Apple)。

  蘋果去年4月收購一家名為 Siri 的公司,該公司之前推出了一個應(yīng)用,能夠識別人們的語音,針對人們提出的問題進(jìn)行回答。Siri 所使用的語音識別技術(shù)由在該領(lǐng)域浸淫已久的 Nuance 所開發(fā)的。此后,蘋果與 Nuance 一直保持接觸,并取得了專利授權(quán),現(xiàn)在大家都知道了,蘋果將在 iOS 5 整合名為 Dragon 的語音識別技術(shù)。因此,iOS 5 也許會內(nèi)建語音識別接口(API)供開發(fā)者調(diào)用。

  而這,有可能讓蘋果開啟下一扇人機(jī)交互的大門。

  語音識別技術(shù)已經(jīng)足夠成熟

  Dragon 語音識別引擎是相當(dāng)?shù)某墒,?iOS 平臺上使用該引擎的 Dragon Dictionary 以極高的識別精確度,效果讓人驚異。而 Android 平臺上由 Nuance 推出的 FlexT9,即使售價為 5 美元都收到 1100 份評論,以及平均 4 顆星的評價?梢娬Z音識別技術(shù)已經(jīng)邁向成熟,能耐得住市場的考驗(yàn)。

  Google 也注意到語音識別技術(shù)的潛力。之前 Google 從 Nuance 中挖來了一位創(chuàng)始人,在 Nuance 工作十年之久的專家。如今用于 Android 上的語音識別技術(shù)被 Slate 評價為“確實(shí)可用”。即使拐著彎問的問題也難不倒它,比如說一英里等于多少埃(計(jì)量單位 1 埃 = 1.0 × 10 -10 米)這樣。

  在手機(jī)越變越大,觸控屏越來越流行的情況下,語音識別技術(shù)讓人能夠用一只手來操作手機(jī),提供了方便。至少,有短信來的時候不必痛苦的按虛擬鍵盤,只需要動動嘴巴就行了。

  蘋果知道如何讓用戶接受新的操控方式

  盡管語音識別技術(shù)已經(jīng)足夠成熟,但未必就能讓如今的手機(jī)更加易用。因?yàn)樾碌牟僮鞣绞降扔诟淖冇脩暨^往的習(xí)慣,這等于用戶過往的經(jīng)驗(yàn)全不管用。假如手機(jī)提供了語音識別功能,但用戶都不去用的話,這項(xiàng)技術(shù)即使再革新也沒有意義。

  因此 Nuance 引導(dǎo) FlexT9 的用戶到一系列的視頻教程去,讓用戶明白如何操作。作為反例,Slate 指出 Android 的語音識別技術(shù)不夠人性,用戶需要念出“逗號”、“句號”才能輸入標(biāo)點(diǎn)符號。

  而蘋果能夠讓消費(fèi)者輕易地接受新的科技:第一個 iPhone 廣告其實(shí)是一個教程,消費(fèi)者從廣告中就學(xué)會如何利用 iPhone 上網(wǎng)、收發(fā)郵件以及搜索附近的商店。最終,消費(fèi)者接受了觸摸操控,也成就了 iPhone 的輝煌。

  如今,語音識別技術(shù)也是一種新的操控方式,而蘋果是去做推廣的廠商。至少蘋果不會只通過枯燥的視頻教程來讓用戶學(xué)會如何用語音來操控手機(jī)。

  蘋果是用戶體驗(yàn)大師

  一個產(chǎn)品有成熟的技術(shù),和成功的推廣,也未必能夠留住用戶的心。

  在 iPhone 之前已經(jīng)有很多款使用觸控屏的手機(jī)出現(xiàn)了,但是蘋果的長處就是讓科技變得簡單易用,貼合人性。這使 iPhone 完成了手機(jī)的設(shè)計(jì)上的革命。現(xiàn)在人們已經(jīng)忘卻了實(shí)體鍵盤,忘卻了軌跡球,取而代之的是一整塊觸控屏。

  通過深度整合語音識別技術(shù),相信蘋果還能讓變革再一次發(fā)生,至少可以讓人們對著手機(jī)說幾句話就能發(fā)一條短信或?yàn)g覽網(wǎng)頁。而對于開發(fā)者來說,語音識別技術(shù)無疑開啟另一扇大門,讓他們的應(yīng)用設(shè)計(jì)更具有想象力。

  我們?nèi)匀粺o法得知蘋果和 Nuance 合作的具體內(nèi)容,但我們有理由相信蘋果能夠成功的把語音識別技術(shù)帶入移動領(lǐng)域。

ifanr.com



相關(guān)閱讀:
車載語音識別十年沉浮路 各領(lǐng)風(fēng)騷幾多年? 2011-05-05
英立訊前置IVR系統(tǒng)優(yōu)勢分析與在農(nóng)行的應(yīng)用 2011-04-28
企業(yè)采用自助IVR應(yīng)用程序節(jié)約成本 2011-04-26
語音識別技術(shù):讓你的智能手機(jī)更聰明 2011-03-31
多人手機(jī)游戲:可愛多的手機(jī)互動營銷案例 2011-03-23

熱點(diǎn)專題:  語音合成TTS 語音識別ASR  
分類信息:  CTI文摘_與_移動  CTI文摘_與_CTI平臺技術(shù)  移動_與_CTI平臺技術(shù)