編者按:本文作者 Vishal Krishna,原文標(biāo)題:Indian Languages need a voice online. Here's how homegrown startups are giving them one.
在13億印度人中,真正會(huì)說(shuō)英語(yǔ)的人不到1億,不管你參考的是哪份報(bào)告。
印度的大多數(shù)網(wǎng)站和應(yīng)用還必須使用英語(yǔ)操作,但現(xiàn)在變化正在發(fā)生——所有的數(shù)字和在線產(chǎn)品/服務(wù)都在向印度本地的語(yǔ)言過(guò)渡。這種變化吸引了新的用戶,但是本土語(yǔ)言的使用還面臨一個(gè)重要挑戰(zhàn)。
這個(gè)挑戰(zhàn)就是語(yǔ)音。
圖片來(lái)源:YourStory
不僅是印度,全世界的初創(chuàng)公司和開發(fā)人員都在大力投資語(yǔ)音技術(shù)。語(yǔ)音技術(shù)省掉了用戶打字的麻煩,能打開全新的用戶市場(chǎng)——包括那些還不懂ABC的小孩子,以及不太會(huì)用手機(jī)鍵盤的老年人等等。
搜索巨頭Google目前支持9種印度語(yǔ)言,而Amazon也在構(gòu)建基于語(yǔ)音技術(shù)的各種功能。
而印度需要的不僅僅是語(yǔ)言支持和語(yǔ)音技術(shù)。像人們常說(shuō)的“內(nèi)容為王”,對(duì)一種語(yǔ)言進(jìn)行精確識(shí)別需要足夠的數(shù)據(jù)來(lái)訓(xùn)練,而印度有多達(dá)17種官方語(yǔ)言(編者校:印度憲法認(rèn)定的官方語(yǔ)言有22種)和數(shù)百種被認(rèn)可的方言。如果想打動(dòng)印度的消費(fèi)者,對(duì)這些不同語(yǔ)言的語(yǔ)音識(shí)別是必經(jīng)之路,盡管這并不容易。
為了彌合這一缺口,幾家初創(chuàng)公司正在幫印度人打造使用本地語(yǔ)言的搜索工具,畢竟每個(gè)人都希望為自己的問(wèn)題搜索到明確的答案。這項(xiàng)工作的難點(diǎn)是:印度缺少使用本地語(yǔ)言的內(nèi)容,或者說(shuō)數(shù)據(jù)。
班加羅爾的Vokal就是這樣一家公司。Vokal由Aprameya Radhakrishna和Mayank Bidawatka創(chuàng)立。用戶可以在該平臺(tái)上使用印度本土語(yǔ)言提問(wèn),然后會(huì)有其他用戶用同樣的語(yǔ)言做出解答。簡(jiǎn)言之,Vokal就好比印度版的Quora,不過(guò)Quora是純文字問(wèn)答平臺(tái),而Vokal則是純語(yǔ)音問(wèn)答。
“語(yǔ)音是未來(lái)。印度的農(nóng)村居民會(huì)更喜歡用語(yǔ)音搜索來(lái)尋找感興趣的內(nèi)容。目前,如果你不會(huì)英語(yǔ),你就很難在各大平臺(tái)上搜索和獲取信息。”Aprameya說(shuō)。他補(bǔ)充說(shuō),Vokal花費(fèi)了大量時(shí)間來(lái)訓(xùn)練機(jī)器學(xué)習(xí)算法,使其能理解各種提問(wèn)并顯示相關(guān)回答。
推薦閱讀:報(bào)告:在亞太地區(qū),中國(guó)人不如印度人愛(ài)用語(yǔ)音助手
YourStory嘗試了Vokal的埃納德語(yǔ)和泰盧固語(yǔ)語(yǔ)音搜索,用它查找了烹飪、農(nóng)作、旅行和健康生活指導(dǎo)等方面的內(nèi)容。和任何初創(chuàng)公司一樣,Vokal還需要一些時(shí)間才能獲得足夠的用戶和用戶使用數(shù)據(jù),進(jìn)而優(yōu)化其AI搜索引擎,達(dá)到99%的準(zhǔn)確率,但它已經(jīng)走出了第一步。投資者顯然也是這么看的,Vokal成立才不到一年半,就已經(jīng)從Kalaari Capital、Accel Partners、順為資本和Blume Venture等投資機(jī)構(gòu)獲得了大約700萬(wàn)美元的融資。
除Vokal外,一些其他的創(chuàng)業(yè)公司也在開發(fā)基于語(yǔ)音的技術(shù)。Reverie Techonologies幾年前就成功推出了用于手機(jī)的印地語(yǔ)輸入法,這種本地化的輸入法廣受歡迎。最近該公司被Reliance Industries以19億盧比(約2772萬(wàn)美元)高價(jià)收購(gòu)。收購(gòu)背后的原因正是Reverie正在開發(fā)的、支持本地語(yǔ)言的語(yǔ)音銀行服務(wù)工具。
Reverie開發(fā)的所有產(chǎn)品和功能的使用場(chǎng)景都是基于具體設(shè)備的(包括手機(jī)、平板、機(jī)頂盒、以及游戲和App的開發(fā)工具)。另外,Reverie還與高通、沃達(dá)豐和三星等公司合作,幫助它們提高旗下電子設(shè)備處理語(yǔ)言的能力。
印度有許多初創(chuàng)公司都在對(duì)語(yǔ)音技術(shù)進(jìn)行探索,但其功能各有不同。比如Gnani。AI,這家公司一直專注于B2B業(yè)務(wù),但現(xiàn)在它正計(jì)劃為農(nóng)戶推出B2C服務(wù),讓他們能夠用本地語(yǔ)言咨詢有關(guān)農(nóng)作物的問(wèn)題。
更有意思的是,Gnani.AI還在嘗試用手機(jī)進(jìn)行語(yǔ)音翻譯和信息讀取。也就是說(shuō)用戶可以將一段語(yǔ)音消息轉(zhuǎn)換為文字,然后將其分享給WhatsApp上的好友。假如有一名用戶會(huì)說(shuō)埃納德語(yǔ),但卻不會(huì)寫,那他/她只要對(duì)著Gnani的平臺(tái)講話,就能將語(yǔ)音轉(zhuǎn)換為埃納德語(yǔ)文字。
除了官方語(yǔ)言,Gnani平臺(tái)也可以將方言轉(zhuǎn)換為文字內(nèi)容。目前,Gnani的主要使用語(yǔ)言是埃納德語(yǔ),但未來(lái)肯定會(huì)擴(kuò)充更多語(yǔ)言。
“我們還在對(duì)產(chǎn)品進(jìn)行測(cè)試,完善算法,以求輸出最準(zhǔn)確的(翻譯)結(jié)果。”Gnani。AI的聯(lián)合創(chuàng)始人Ganesh Gopalan表示。
重量級(jí)企業(yè)玩家中,想要占據(jù)語(yǔ)音和地方語(yǔ)言市場(chǎng)的也不止收購(gòu)了Reverie的RelianceIndustries一家。去年,F(xiàn)lipkart收購(gòu)了Liv.AI,F(xiàn)lipkart的首席執(zhí)行官Kalyan Krishnamurthy表示,Liv。AI可以使用支持當(dāng)?shù)卣Z(yǔ)言的語(yǔ)音技術(shù)來(lái)完成交易、進(jìn)行付款、提供客戶服務(wù)以及與賣家互動(dòng)。Liv.ai由Subodh Kumar、Sanjeev Kumar和Kishore Mundra三人聯(lián)合創(chuàng)辦,該公司將來(lái)會(huì)幫助Flipkart以本地語(yǔ)言與顧客交流,不管是通過(guò)語(yǔ)音還是文字。
Vernacular。ai則代表了語(yǔ)音應(yīng)用的另一種可能。Vernacular想建立一個(gè)可以應(yīng)對(duì)印度不同語(yǔ)言的自動(dòng)化呼叫中心。目前它可以自動(dòng)化對(duì)幾家賓館和餐廳的預(yù)約,客人只需說(shuō)出自己的需求就可進(jìn)行預(yù)約,而不用在線上等著和客服交流。
根據(jù)一篇《語(yǔ)音識(shí)別市場(chǎng)》的報(bào)告,語(yǔ)音技術(shù)市場(chǎng)預(yù)計(jì)將從2018年的75億美元增長(zhǎng)到2024年的215億美元,復(fù)合年增長(zhǎng)率為19.18%。對(duì)語(yǔ)音識(shí)別市場(chǎng)強(qiáng)勁增長(zhǎng)的預(yù)期有很多原因,包括其在醫(yī)療保健類應(yīng)用方面的潛力、手機(jī)銀行類應(yīng)用中不斷增長(zhǎng)的對(duì)語(yǔ)音認(rèn)證需求、多功能設(shè)備和智能音箱的快速普及,以及在AI幫助下不斷提高的語(yǔ)音識(shí)別的準(zhǔn)確性。
該報(bào)告補(bǔ)充說(shuō),微觀語(yǔ)言學(xué)、教育和自動(dòng)駕駛等領(lǐng)域都可能為語(yǔ)音識(shí)別公司創(chuàng)造巨大的增長(zhǎng)機(jī)會(huì)。
在印度,隨著使用移動(dòng)流量的用戶指數(shù)級(jí)增長(zhǎng),本地語(yǔ)言的使用需求會(huì)越來(lái)越大,有太多的場(chǎng)景會(huì)需要用到本地語(yǔ)言,F(xiàn)在行業(yè)內(nèi)的所有的努力——不僅包括Google和Amazon等巨頭的努力,也包括本地初創(chuàng)公司的努力——都是未來(lái)市場(chǎng)所必需的。希望很快印度人能夠以本地語(yǔ)言搜索信息并獲得本地化的答案。