LiveVideoStack:馬曉宇你好,非常開心邀請到您接受LiveVideoStack的采訪。能否向我們的讀者介紹下自己?
馬曉宇:大家好,我是馬曉宇,當(dāng)前在環(huán)信任職首席技術(shù)官,負(fù)責(zé)及時(shí)通訊相關(guān)的研發(fā)工作。
我工作的20多年里,先后經(jīng)歷了電信行業(yè)、互聯(lián)網(wǎng)、開源軟件以及移動(dòng)互聯(lián)網(wǎng)這四個(gè)業(yè)務(wù)發(fā)展的高峰期。在1998年我加入諾基亞,從事短信中心的開發(fā),見證了諾基亞,摩托羅拉,整個(gè)通信行業(yè)在中國爆發(fā)式的發(fā)展。
到2001年互聯(lián)網(wǎng)的發(fā)展第一次到達(dá)了頂峰,我也隨著這波浪潮去美國繼續(xù)做軟件開發(fā)的工作,在此期間也不幸看到了互聯(lián)網(wǎng)的第一次破滅。在此之后我回國開始做eclipse和apache 基金會(huì)的開源軟件,在其中我們更多的工作是面對電信、銀行這類的客戶做服務(wù)器的中間件。
2008年我開始覺得整個(gè)大環(huán)境的技術(shù)方向應(yīng)該會(huì)向移動(dòng)端發(fā)展,所以在那年我加入了Symbian(塞班),主要工作是做手機(jī)操作系統(tǒng)和移動(dòng)端應(yīng)用。
2013年發(fā)現(xiàn)移動(dòng)互聯(lián)網(wǎng)開始出現(xiàn)大量的創(chuàng)業(yè)公司,所以從2013年開始做為移動(dòng)開發(fā)者提供技術(shù)通信的平臺(tái)。到目前為止即時(shí)通訊依然是環(huán)信的主要業(yè)務(wù),我個(gè)人最近比較關(guān)注人工智能以及5G的熱門話題。
LiveVideoStack:目前IM通訊的市場在國內(nèi)和國際上大概的格局是怎樣的?
馬曉宇:2014年4月我們上線了第一個(gè)即時(shí)通信云服務(wù),在做即時(shí)通訊云服務(wù)方面環(huán)信是國內(nèi)第一家。最初這只是幾個(gè)人聊天當(dāng)中的一個(gè)想法,變成了企業(yè)服務(wù)里一個(gè)細(xì)分行業(yè),很多公司都共同在做這個(gè)事情,大家也都是為了更好的服務(wù)用戶和開發(fā)者。之前整個(gè)行業(yè)是以像環(huán)信這樣的創(chuàng)業(yè)公司為主,但從近兩年開始,可以看到騰訊、網(wǎng)易都在重點(diǎn)投入這個(gè)方向,因?yàn)榇蠹叶加X得這是云服務(wù)里PaaS平臺(tái)的基礎(chǔ)服務(wù),并且是開發(fā)者生態(tài)閉環(huán)中一個(gè)重要組件。所以目前即時(shí)通訊服務(wù)的競爭相對比較激烈,既有互聯(lián)網(wǎng)公司和創(chuàng)業(yè)公司,也有像騰訊這樣的TOP企業(yè)。
整個(gè)市場還處于快速發(fā)展的階段,從環(huán)信自己的業(yè)務(wù)出發(fā),包括已經(jīng)上線的應(yīng)用本身來看,我們注意到兩個(gè)比較大的趨勢,一是從去年開始,開發(fā)者更多的從原生應(yīng)用開始轉(zhuǎn)向做一些小程序和流量入口,這是目前逐漸顯現(xiàn)的趨勢。在環(huán)信的后臺(tái)也能看到越來越多的用戶不再去做Native而是轉(zhuǎn)去做小程序,不管是在IM還是客服方面。另外從后臺(tái)數(shù)據(jù)也可以看到,越來越多用戶從基本的文字、圖片聊天逐漸趨向?qū)崟r(shí)語音和實(shí)時(shí)視頻,在環(huán)信即時(shí)通訊云服務(wù)上我們也感受到了這中溝通方式上的變化。
LiveVideoStack:即時(shí)通訊從單純的文字、圖片向?qū)崟r(shí)視頻的轉(zhuǎn)變,對于公司和后端處理能力的要求自然也相應(yīng)提高,環(huán)信針對這種變化做了哪些工作,又為用戶提供了哪些產(chǎn)品和服務(wù)?
馬曉宇:目前環(huán)信主要提供兩個(gè)產(chǎn)品,一個(gè)是音視頻云(PaaS服務(wù))以API的形式提供底層和一對一、一對多的音視頻能力。在PaaS服務(wù)中也包括一些基于移動(dòng)端的遠(yuǎn)程控制和桌面共享,白板等功能,都是和音視頻相關(guān)的底層能力,用戶在此基礎(chǔ)上可以開發(fā)不同的包括社交、企業(yè)會(huì)議、互動(dòng)直播,甚至是手表、醫(yī)護(hù)、看護(hù)設(shè)備場景。
另一個(gè)是用環(huán)信音視頻的能力在客服行業(yè)落地的完整產(chǎn)品——視頻客服,其中太平洋保險(xiǎn)、南方航空、廣東電信都已經(jīng)陸續(xù)上線了這個(gè)系統(tǒng),包括公有云上的中意人壽也在使用環(huán)信的視頻客服。
視頻客服有兩個(gè)主要的場景,一個(gè)是可以對VIP客戶提供更好的服務(wù),比如你是南方航空的VIP客戶,那么在APP里你的客服就具有視頻客服的功能,在后臺(tái)有專業(yè)的視頻坐席對服務(wù)進(jìn)行保障。太平洋保險(xiǎn)已經(jīng)上線了一千個(gè)視頻坐席,包括中意人壽也在逐步上線一些涉及視頻技術(shù)的功能,這已經(jīng)是目前企業(yè)發(fā)展的必然。在保險(xiǎn)行業(yè),我們在也在支持保險(xiǎn)遠(yuǎn)程勘察等業(yè)務(wù)。
LiveVideoStack:我們知道環(huán)信發(fā)布音視頻2.0的版本,在此次更新里有哪些新的特性、功能,以及在用戶體驗(yàn)方面有哪些提升?
生曦:我是生曦,目前在環(huán)信任職IM產(chǎn)品經(jīng)理,對IM技術(shù)與使用場景的整體產(chǎn)品方案非常感興趣,最近這段時(shí)間一直在調(diào)研市場各行業(yè)中受5G影響以后的發(fā)展趨勢,近幾年我們會(huì)面臨行業(yè)上的巨大挑戰(zhàn),這其中行業(yè)中的多數(shù)競品企業(yè)在不斷的推新以及功能不斷的完善,未來將會(huì)是人人都是開發(fā)者的時(shí)代。每個(gè)團(tuán)隊(duì)都有更多的資源和可以直接利用的一些技術(shù)來服務(wù)自己的產(chǎn)品,在這些前提之下我們需要做出更多才能夠脫穎而出。我們調(diào)研中發(fā)現(xiàn),很多應(yīng)用尤其是社交類型應(yīng)用所需要的技術(shù)服務(wù)越來越多樣,只有做到把社交類用戶的使用場景全面覆蓋,再從部分垂直領(lǐng)域深挖場景,才能提高我們未來的產(chǎn)品競爭力。就如同之前所說的保險(xiǎn)業(yè)務(wù)和VIP視頻客服服務(wù),在垂直行業(yè)里找到我們核心的商業(yè)模式。整個(gè)音視頻在社交場景的全覆蓋只是一個(gè)開始,以后會(huì)不斷地為更多的場景服務(wù),在其中找到更多的突破口,這也是環(huán)信在2.0版本所做出的改變。
LiveVideoStack:既然環(huán)信是為開發(fā)者服務(wù),那一定會(huì)涉及到工具友好性和學(xué)習(xí)曲線的問題,開發(fā)者在使用前是否需要熟悉大量的開發(fā)文檔,針對調(diào)試過程中出現(xiàn)的問題環(huán)信做了哪些準(zhǔn)備?
生曦:環(huán)信已經(jīng)成立了很多年,IM作為我們最底層PaaS平臺(tái)的基礎(chǔ),在音視頻領(lǐng)域也會(huì)有同樣的底層基礎(chǔ)支持,我們有豐富的SDK開發(fā)工具包,在此基礎(chǔ)上用戶作為開發(fā)者不需要對太多的技術(shù)底層有過多的了解,反而會(huì)更像IM一樣根據(jù)需求調(diào)用相應(yīng)的接口調(diào)試,以此來完成移動(dòng)端、移動(dòng)設(shè)備、Web端、Web設(shè)備和服務(wù)端的集成工作。
同時(shí)環(huán)信現(xiàn)在有大量的TC項(xiàng)目(一款語音連麥體驗(yàn)App),在2.0版本中推出了很多新功能,比如頻道的廣播控制遠(yuǎn)端其他主播的視頻技術(shù),豐富了RestAPI服務(wù)端的功能,這些都可以通過服務(wù)端直接去調(diào)用。我們也針對開發(fā)者的問題形成了接口功能梳理的文檔,讓用戶能夠通過文檔來理解和調(diào)用接口,真正做到從用戶的角度出發(fā),模擬用戶的思想,明確用戶的最終需求,圍繞這些來形成更高意義上的集成方案。
馬曉宇:補(bǔ)充一下,項(xiàng)目的功能具體到音視頻方面的開發(fā)門檻較高,環(huán)信一直想做對開發(fā)者有足夠友好度的SDK,比如處理通話的不同狀態(tài)以及網(wǎng)路情況,我們把諸如此類的功能都盡量添加到SDK里。具體來說,我們在SDK里會(huì)有網(wǎng)絡(luò)自適應(yīng)和帶寬自適應(yīng)的模塊,在網(wǎng)絡(luò)狀況不好的環(huán)境下視頻會(huì)自動(dòng)降低分辨率,不需要集成工程師額外的處理。另外對于部分低端安卓設(shè)備在錄音時(shí)會(huì)有的回聲問題,我們針也對這些安卓設(shè)備做了一定的回聲消除適配,在不同的設(shè)備上調(diào)整不同的參數(shù),這就是環(huán)信站在開發(fā)者角度去思考,節(jié)省用戶的工作量,主動(dòng)來負(fù)責(zé)相對較為復(fù)雜的部分。接下來環(huán)信會(huì)將TC以開源的形式發(fā)布,在此之后也會(huì)陸續(xù)發(fā)布一系列和音視頻應(yīng)用相關(guān)的資源,包括服務(wù)端、客戶端的Demo和完整應(yīng)用,對開發(fā)者和創(chuàng)業(yè)者來說可以參考Demo來實(shí)現(xiàn)需求的應(yīng)用場景,相應(yīng)的軟件友好度也會(huì)上升。
LiveVideoStack:在使用過程中有兩個(gè)場景,第一個(gè)是開發(fā)者可以作為一個(gè)最小MVP測試,通過調(diào)用接口可以快速實(shí)現(xiàn)產(chǎn)品Demo,開發(fā)者可以僅在內(nèi)部上線并收集用戶反饋,如果得到的反饋良好便再繼續(xù)跟進(jìn)做一些更詳細(xì)的功能,能夠很大程度上降低創(chuàng)業(yè)團(tuán)的的開發(fā)成本。環(huán)信提供了很多文檔,如果開發(fā)者在運(yùn)行過程中出現(xiàn)問題或是難點(diǎn),怎么快速檢測這個(gè)問題,環(huán)信有沒有類似的應(yīng)用支持,快速為開發(fā)者做出反饋和解決?
馬曉宇:基于環(huán)信一直在為開發(fā)者服務(wù),所以有一套完整的技術(shù)支持體系,從QQ群、工單再到社區(qū),以及VIP客戶的專屬群有著明確的分級體系,針對不同的客戶有不同的響應(yīng)辦法,普通客戶也可以通過提交工單,通過我們的技術(shù)交流群和社區(qū)提出問題并得到及時(shí)的響應(yīng)和反饋。并且我們在內(nèi)部設(shè)有不同的SLA,不同的問題分多長的時(shí)間處理,都有明確的體系去做規(guī)定。
生曦:針對公司服務(wù)來說,由于常年的經(jīng)驗(yàn)積累,我們有IM和客服,所以不管是PaaS還是SaaS公司都有比較完善的銷售鏈條。部門和部門之間處理用戶的問題,比如說前置和銷售的問題我們有咨詢電話和銷售的支持,中間過程的技術(shù)支持會(huì)以提交工單的形式予以解決或反饋,對于VIP用戶處理速度相對要快一些。其余有關(guān)線上報(bào)錯(cuò)或者故障的問題我們在15分鐘內(nèi)就能及時(shí)修復(fù),包括技術(shù)性或者產(chǎn)品性的問題,在CSM團(tuán)隊(duì)以及產(chǎn)品團(tuán)隊(duì)都會(huì)用相互溝通和交流的方式,將用戶的問題拆分成當(dāng)下可以解決和未來才能解決兩個(gè)方面,以此來對用戶進(jìn)行更好的反饋。
LiveVideoStack:TC的開發(fā)團(tuán)隊(duì)正在做哪些具體的工作,未來開發(fā)者會(huì)有哪些新功能或體驗(yàn)上的改進(jìn)?
生曦:目前新推出的2.0版本是面向未來所有場景全覆蓋的開始,要完全實(shí)現(xiàn)這個(gè)目標(biāo)還有很長的一段路要走,以下我主要介紹一下未來環(huán)信發(fā)展的五個(gè)關(guān)鍵點(diǎn)。
- 第一是環(huán)信現(xiàn)在在做的語音連麥聊天室,語音的玩兒法有很多,目前我們已經(jīng)能完全構(gòu)建和覆蓋例如陌陌這樣的場景。但這只是一個(gè)開始,后面還有像狼人殺和劇本殺這種,同一個(gè)聊天室當(dāng)中有不同的角色,這些角色之間在某一個(gè)場景下是互相隔離并且能夠區(qū)分出不同的玩兒法和場景,我們會(huì)在下一階段很快的對這部分內(nèi)容做出補(bǔ)充和提出解決方案,讓用戶在聊天室玩兒法層面不再是廣播式的統(tǒng)一得到信息,而是變成非對稱式,每個(gè)人得到的信息都不完整,互相通過語音結(jié)合信息會(huì)產(chǎn)生很多有意思的點(diǎn)。
- 第二點(diǎn)是視頻連麥,從語音連麥聊天室開始陌陌就一直在占有主流的社交市場,其他類似的應(yīng)用也會(huì)逐步完善場景,達(dá)到向主流聊天室推進(jìn)的目的,新生代的一些泛娛樂化應(yīng)用會(huì)追隨著腳步不斷地推廣自己的應(yīng)用。隨著流量以及帶寬的逐漸升級,像YY中視頻PK的娛樂場景變得非;鸨。站在環(huán)信的角度來看我們應(yīng)該進(jìn)一步的完善和攻克這個(gè)場景,做到兩個(gè)或兩個(gè)以上的所有視頻主播,通過連麥和服務(wù)器混流直播,實(shí)現(xiàn)五千到一萬人以上的大群連麥直播。讓每一個(gè)觀眾都有機(jī)會(huì)申請和主播連麥并開通視頻。
- 第三點(diǎn)是連麥之后我們可以對接不同的CDN廠商并進(jìn)行大范圍的直播和廣播,這其中也包括IM和音視頻的一些工作,以此來支持五千到一萬人以上甚至有些內(nèi)部項(xiàng)目已經(jīng)能夠支持18萬人以上的大型直播間,這是第三點(diǎn)在廣度、承載量以及并大量上都能有顯著的提升。
- 第四點(diǎn)有關(guān)視頻和音頻的處理,AI變聲和FaceAI的模擬圖像就是其功能上的最佳體現(xiàn)。這些其實(shí)是在交友娛樂過程當(dāng)中必不可少的一些成分,環(huán)信也會(huì)對實(shí)時(shí)音視頻的數(shù)據(jù)源進(jìn)行一些開放性的處理,讓用戶可以對接各種各樣的音頻變聲和視頻變聲,再把這些實(shí)時(shí)變化的效果、音頻、音效反饋到IPC,通過實(shí)時(shí)音頻再去和連麥直播做融合。這樣做能夠使整個(gè)產(chǎn)品豐富起來,用戶的互動(dòng)體驗(yàn)也會(huì)得到相應(yīng)的提升。
- 第五點(diǎn)更多是關(guān)注于社交領(lǐng)域的一些更深層次的玩兒法,例如能夠使兩個(gè)或多個(gè)直播間實(shí)現(xiàn)實(shí)時(shí)合并以及拆解功能,讓多個(gè)主播和粉絲群能夠快速的打通和拆解,讓整個(gè)用戶關(guān)系從一點(diǎn)對多的廣播室關(guān)系變成雙點(diǎn)直播以及交叉式的合作關(guān)系,使得用戶的社交行為發(fā)生更深層次的改變。目前抖音和微博都是通過點(diǎn)贊和關(guān)注實(shí)現(xiàn)關(guān)系鏈的推薦與到位,實(shí)時(shí)關(guān)系鏈的推薦和融合可能是未來更快建立社交關(guān)系的一種方式。
以上五點(diǎn)可能是環(huán)信現(xiàn)在正在進(jìn)行推進(jìn)或者之后可能會(huì)跟進(jìn)的一些事情,之后版本推出的一些改進(jìn)將會(huì)改變玩兒法上的一些東西。對我們來說,不能總是依賴客戶去思考未來應(yīng)用產(chǎn)品的需求以及定義IM環(huán)境的技術(shù),而是應(yīng)該主動(dòng)去發(fā)現(xiàn)未來社交情況的改變并及時(shí)做出底層的技術(shù)支持,幫助用戶構(gòu)建未來的應(yīng)用場景。這在所有的社交場景基本往下或者是覆蓋的足夠全面的情況下,另一條線將會(huì)找到我們從PaaS轉(zhuǎn)成SaaS的核心競爭力,或是為某些專屬客戶提供底層更高性能的企業(yè)級服務(wù),為航空、教育類的企業(yè)帶來基本的特性。
LiveVideoStack:目前有很多獨(dú)立的SDK,但在功能上具有局限性,環(huán)信目前是想把部分功能集成在一起,提供更為完整的體驗(yàn)場景和玩兒法嗎?
生曦:這其實(shí)是一把雙刃劍,一方面我們需要把音視頻這部分做的足夠?qū)>,又需要把IM做的足夠廣泛。如果音視頻只局限于部分使用場景,無法更好的覆蓋客戶更多的業(yè)務(wù),就會(huì)造成用戶在很多廠家中無法做出選擇的局面。另一方面,好處是我們能夠提供一個(gè)完整的用戶體系,用戶不需要對用戶體系對接深入理解,只需要用一個(gè)就可以完成音視頻和IM通訊以及對接用戶自己的服務(wù),這些功能隨著業(yè)務(wù)量的發(fā)展在使用時(shí)就會(huì)具有一定的優(yōu)勢。
LiveVideoStack:環(huán)信在5G的發(fā)展趨勢下,有哪些需要把握的機(jī)會(huì)?
馬曉宇:5G也是我們一直在關(guān)注的方向,中國5G的牌照已經(jīng)發(fā)放,比我們預(yù)想的時(shí)間還要早一些,明年年底經(jīng)過一年半的換代時(shí)間,主流人群應(yīng)該都能使用5G手機(jī),整個(gè)技術(shù)也是完全成熟的。在4G時(shí)代經(jīng)歷了幾個(gè)場景,一個(gè)是圖片社交,當(dāng)時(shí)有大量圖片社交類的應(yīng)用爆發(fā),這其中包括我們的用戶,但這波熱度隨著直播應(yīng)用的興起很快便冷卻下去,之后抖音這批短視頻社交應(yīng)用又使得用戶數(shù)量到達(dá)巔峰。環(huán)信在2015年開始服務(wù)的一個(gè)應(yīng)用Musical.ly就是做短視頻社交,僅用一年的時(shí)間就做到了上千萬的海外日活,抖音的場景界面在一定程度上參考了環(huán)信的Musical.ly。
我們的確看到4G時(shí)代發(fā)展和應(yīng)用爆發(fā)用一年時(shí)間就席卷全球,而5G的帶寬是4G的幾十倍,達(dá)到真正的千兆級帶寬,這本身是非常好的底層基礎(chǔ)設(shè)施。環(huán)信目前看到有幾個(gè)需求,一個(gè)是基于高清的視頻社交,另一個(gè)是一些比較有價(jià)值的企業(yè)級應(yīng)用,例如企業(yè)遠(yuǎn)程協(xié)助和企業(yè)會(huì)議,這些我們都有在做開發(fā)和相關(guān)的技術(shù)鋪墊,還有一個(gè)場景和環(huán)信的業(yè)務(wù)緊密結(jié)合,這其中包含5G和人工智能這兩個(gè)快速成熟的關(guān)鍵點(diǎn),目前可見技術(shù)上的大趨勢是基于AR、5G以及最新人工智能技術(shù)的虛擬客服。
在此之外有幾個(gè)和環(huán)信有關(guān)的技術(shù)我們在跟進(jìn),3G/4G時(shí)期環(huán)信主要做即時(shí)通訊和推送,這其中必然會(huì)產(chǎn)生大量的業(yè)務(wù)成本,相反5G在核心網(wǎng)設(shè)計(jì)的時(shí)候就考慮到如何低成本的支持物聯(lián)網(wǎng)。目前環(huán)信還在觀望5G真正落地之后如何與現(xiàn)有的技術(shù)相結(jié)合,有沒有可能大幅度降低通知和推送的業(yè)務(wù)成本,以及5G的低時(shí)延應(yīng)用場景實(shí)現(xiàn)等問題。