CTI論壇(ctiforum.com)(編譯/老秦): 隨著企業(yè)轉(zhuǎn)向它來改善客戶體驗(yàn),對話式人工智能正在繼續(xù)發(fā)展。
對話式AI 的話題無疑是一個熱門話題,這是理所當(dāng)然的。在當(dāng)今的商業(yè)競爭中,客戶體驗(yàn) (CX) 至高無上,但確保高質(zhì)量的 CX 并不像以前那么容易。大流行加速了數(shù)字化轉(zhuǎn)型計(jì)劃。我的研究表明,74% 的公司將數(shù)字化計(jì)劃至少提前了一年,其中約三分之一的公司提前了兩年或更長時間。
今天,我們生活在一個數(shù)字交互成為常態(tài)的世界。我看到麥肯錫最近的一項(xiàng)研究表明,58% 的客戶互動是數(shù)字化的,55% 的產(chǎn)品和服務(wù)已經(jīng)數(shù)字化。企業(yè)的快速數(shù)字化引起了人們對對話式人工智能的極大興趣。然而,對話式人工智能的行業(yè)定義非常狹窄,它圍繞使用該技術(shù)使聊天機(jī)器人能夠與客戶互動。顯然,人們不僅僅使用聊天機(jī)器人與品牌交流。
這方面的證據(jù)來自最近發(fā)布的 Gartner 企業(yè)對話式人工智能平臺魔力象限。雖然我無法訪問整個報告,但我確實(shí)知道第一行的陳述:"企業(yè)對話式AI 平臺自動化企業(yè)內(nèi)的多個聊天機(jī)器人用例,創(chuàng)建跨多個業(yè)務(wù)部門編排和操作的機(jī)器人。"如果這不是一個狹義的定義,我不知道是什么。
聊天機(jī)器人很重要,而且它們的使用一直在增長,但對話式人工智能還應(yīng)該包括任何圍繞對話展開的東西,特別是:
●數(shù)據(jù)人工智能:分析數(shù)據(jù)對于在對話中發(fā)現(xiàn)洞察力至關(guān)重要。這與理解對話不同,但包括報告、分析、應(yīng)用程序集成、安全和欺詐檢測。大多數(shù)參與聊天機(jī)器人的供應(yīng)商也在開發(fā)某種形式的數(shù)據(jù)人工智能。
●語音人工智能:這將是一種實(shí)時技術(shù),可以理解人們在說什么,并使用該信息來提供自動響應(yīng)或?yàn)樽峁⿲M足客戶至關(guān)重要的信息。今天很多供應(yīng)商都在這樣做,包括英偉達(dá)、谷歌等,這是一個爆炸性的領(lǐng)域。該領(lǐng)域最好的供應(yīng)商之一是 Otter.ai,它擁有我用過的最好的轉(zhuǎn)錄引擎之一。這是目前在 Zoom 會議中使用的技術(shù)。
●視頻人工智能:這是使用人工智能剖析視頻并使用該信息改善客戶和員工互動的能力。視頻 AI 廣泛應(yīng)用于一些行業(yè),例如自動駕駛汽車,可以快速識別道路上的物體。思科為Webex加載了視頻 AI 功能以識別人員。聯(lián)絡(luò)中心用例是讓客戶向座席展示用于服務(wù)目的的視頻。想象一下,客戶向座席展示了一個復(fù)雜的對象,例如家用電器,座席很容易指導(dǎo)客戶如何更換它。
●情緒檢測:可以將其視為視頻人工智能,但我認(rèn)為這是視頻中的一個專業(yè)領(lǐng)域,值得一提。雖然一些供應(yīng)商將他們的解決方案宣傳為基于單詞選擇對語音通話進(jìn)行情緒檢測,但正在開發(fā)人工智能技術(shù),以更好地了解人們基于肢體語言和面部表情的反應(yīng)。除了視覺提示外,更先進(jìn)的系統(tǒng)將被訓(xùn)練通過考慮節(jié)奏、音調(diào)、單詞選擇和其他上下文來源的變化來理解對話中的音調(diào)變化(呼吁解決問題或呼吁獲得更多的好處)。此功能可用于多個行業(yè),包括醫(yī)療、教育、法律、零售等。想象一個用例,醫(yī)生通過視頻向患者解釋復(fù)雜的事情。人工智能引擎可以檢測到患者的困惑或注意力不集中,然后在醫(yī)生這邊發(fā)送一個彈出窗口,說患者不理解。情緒檢測 AI 的另一個用例:當(dāng)大多數(shù)學(xué)生沒有注意或沒有參與時,可以通知老師。
大約一年前,JC2 (John Chambers) Ventures 支持Uniphore,收購 Emotion Research Labs 進(jìn)軍視頻 AI 領(lǐng)域。有幾家小公司在這個領(lǐng)域開展業(yè)務(wù),例如 visio.ai,但Uniphore是唯一一家在情緒檢測方面投入巨資的"主流"對話式人工智能公司,作為其平臺方法的一部分。我知道Nvidia也在這方面開展工作,我希望它很快就會被添加到其 Maxine 產(chǎn)品中。
對話式AI 的演變是我在上面鏈接的Uniphore帖子中討論的內(nèi)容。在帖子中,我提到了我與錢伯斯的一次對話,他對對話式人工智能的愿景是,它將成為所有形式的人工智能的平臺,包括語音、視頻和數(shù)據(jù)。當(dāng)時,我在視頻中加入了情緒檢測,但我相信這是一門獨(dú)立的學(xué)科。
關(guān)于對話式AI 的最新 Gartner MQ 的最后一項(xiàng)觀察是報告中列出了多少供應(yīng)商以及它們的位置。目前有21家公司上市,最大的廠商群體在左下角(小眾玩家),市場分散。雖然有幾個較大的供應(yīng)商加入了這個 MQ(谷歌、AWS 和 IBM),但我預(yù)計(jì)隨著時間的推移,我們會看到其他供應(yīng)商加入,比如微軟、思科和 Salesforce。對買家來說,好消息是不乏供應(yīng)商選擇。壞消息是市場可能會保持分散,直到出現(xiàn)一些整合。
因此,如果 Gartner 將對話式AI 解決方案納入更廣泛的范圍,那么供應(yīng)商的樣本將會大大減少,甚至可能只有Uniphore、微軟、IBM、Nvidia和思科。然而,將對話式人工智能限制在聊天機(jī)器人上并不能推動技術(shù)進(jìn)步和推動平臺概念的發(fā)展。對對話式AI 的需求持續(xù)增長,該類別需要相應(yīng)調(diào)整。
如果業(yè)界采用更廣泛的對話式人工智能定義,問題就變成了:如何評估競爭解決方案?這是一個起點(diǎn):顧名思義,要成為對話式人工智能的領(lǐng)導(dǎo)者,你需要擅長兩件事--對話和人工智能。需要明確的是,不僅僅是使用通常僅限于簡單的命令動作或問答交互的語音技術(shù)(想想 Siri 和 Alexa)。這些系統(tǒng)與圍繞復(fù)雜性、細(xì)微差別和來回對話構(gòu)建的系統(tǒng)不同。此外,他們應(yīng)該能夠根據(jù)他們從你的聲音中聽到的任何情緒等來獲得意義,甚至能夠總結(jié)和回憶以前的故事或?qū)υ捵龀鰧?shí)時反應(yīng)。依靠強(qiáng)大的人工智能和自動化,對話能力可以指導(dǎo)行動、觸發(fā)、直接行動、觸發(fā)結(jié)果、跟進(jìn)等。
可以這么說,下一波浪潮的長期贏家將是那些對他們正在解決的問題采取整體看法、專注于各種對話:語音、文本和視頻并擁有人工智能/機(jī)器學(xué)習(xí)的人印章以真正最大化每一次對話的價值。
做好準(zhǔn)備--這將是一場瘋狂的旅程。
聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
原文網(wǎng)址:https://www.nojitter.com/ai-speech-technologies/redefining-conversational-ai-what-gartners-mq-tells-us