首頁>>>行業(yè)應(yīng)用>>>移動     [相關(guān)廠商信息]

Myspace首席技術(shù)官譚曉生:移動社區(qū)搜索

2008/12/19

  12月18日-19日,第二屆CNGI工程技術(shù)論壇暨移動互聯(lián)網(wǎng)國際峰會在北京召開,會上,工信部副部長奚國華、中國移動副總裁沙躍家、中國工程院副院長鄔賀銓、以及各大設(shè)備廠商、終端制造商、內(nèi)容服務(wù)提供商等出席了會議并做了主題演講。

  以下是Myspace首席技術(shù)官譚曉生的演講實錄。

  譚曉生:謝謝主持人,剛才前面幾位嘉賓很多都談到了facebook和Myspace,今年三月份我們給這個網(wǎng)站起了一個中文名字叫做聚友網(wǎng),Myspace對中國很多用戶聽起來都會有很多的困難的。Myspace是從互聯(lián)網(wǎng)起家的SNS網(wǎng)站。因為它有非常龐大的互聯(lián)網(wǎng)的基礎(chǔ),所以開始比較早的進(jìn)入到手機(jī)的應(yīng)用,從Web的應(yīng)用到嵌入式客戶端的應(yīng)用都有,目前在Myspace.com有各種各樣的傳統(tǒng)的操作系統(tǒng)方面的應(yīng)用,也有比較新的像iphone上面的,像Google的系統(tǒng)下面都有客戶端的SNS的應(yīng)用,但是應(yīng)用的模式基本上還是從互聯(lián)網(wǎng)到手機(jī)的擴(kuò)展,沒有太多的做完全基于手機(jī)的SNS,更多的把互聯(lián)網(wǎng)上SNS的功能移植到手機(jī)的客戶端上,方便用戶的使用,目前還是處于這樣的階段。

  對于Myspace中國來說,聚友網(wǎng)我們在08年推出了第一個免費版本,也是考慮到中國手機(jī)的用戶和互聯(lián)網(wǎng)的用戶,其實用戶使用體驗和西方的用戶差別都比較大。今天談到的題目是移動社區(qū)搜索,在07年5月份我們就組建了一支團(tuán)隊,是來做個性化的信息搜索,這里面正好在移動社區(qū)收縮當(dāng)中可以使用到這樣一個技術(shù)。首先這是一個背景數(shù)字,我就不過多的做介紹了,中國互聯(lián)網(wǎng)的用戶市場仍然是保持非?焖俚脑鲩L的。社區(qū)交友的用戶量也非常大,而且尤其在東亞區(qū),對SNS的使用比例也是比較高的。

  用戶為什么在社區(qū)里面要使用搜索?這種使用其實還是有點不太一樣,在社交網(wǎng)絡(luò)里面,他如果要來搜索,第一個會在已經(jīng)存在的人際關(guān)心網(wǎng)絡(luò)里面找到其中某一個人,或者某一個人的信息,在SNS里面分,分network和networking兩種不同的分支,第一個network是把已經(jīng)有的社交網(wǎng)絡(luò)搬到移動互聯(lián)網(wǎng)或者客戶端進(jìn)行訪問,這種要找已經(jīng)有的這些朋友,找到已經(jīng)有的聯(lián)系人,然后找到已經(jīng)有的聯(lián)系人,基本上一個要看他最近有什么樣新的動向,比如說他web狀態(tài)信息是什么,或者他現(xiàn)在和誰又成為了朋友,他新發(fā)了一張照片或者新寫了一篇博客等等,這是對已有朋友的了解,找到這個人以及這個人相關(guān)的信息。還有一種需求是在陌生的環(huán)境里,他要交新的朋友,像networking這種應(yīng)用,就是要找一個人去聊一聊,要結(jié)識新的朋友,一般的目的一個是為了打發(fā)時間,另外就是為了找一些艷遇這也是非常正常的。在陌生人的網(wǎng)絡(luò)里面,陌生人的量是非常大的,在Myspace有3億多注冊用戶,在聚友網(wǎng)內(nèi)也有差不多將近600萬的用戶,在這里面你找到什么樣的人是你所需要的,如果一個個看和聊成本是非常高的。另外他不是為了找人,他上來是為了找有趣的內(nèi)容,比如很多上聚友網(wǎng)的內(nèi)容很多的是為了看博客和照片,尤其是看照片是第一需求,找各種各樣的照片看,看到誰比較來電,就會去看看這個人寫的博客,或者去他的空間看一看,這是一種比較典型的應(yīng)用。我們?nèi)绻谑謾C(jī)終端上做這樣的服務(wù)就相當(dāng)?shù)睦щy,比互聯(lián)網(wǎng)還要難。手機(jī)終端的展現(xiàn)能力比較有限,你看照片的話不可能看尺寸太大的照片,如果看空間的話,往往都是抽象出來,比如說這個名字是什么,昵稱是什么,多大年齡,是男的還是女的,這些信息的展現(xiàn)非常有限,和互聯(lián)網(wǎng)的應(yīng)用有很大的差別。在這種情況下,用戶的互動也不會像電腦上一樣,找的如果不太合適很方便的翻頁,可以瀏覽的比較快,通過手機(jī)終端去做的時候,交互的速度相對比較慢,通過大量得按鍵操作,這個時間也相對來講比較長,這里面就有如何我們給用戶提供,僅僅是給自己有用的信息。其實我們有一個理念,什么東西是信息呢?信息是用戶能夠信任的,并且和用戶息息相關(guān)的這些消息才稱之為信息,對于用戶是有用的這些信息。

  怎么解決這些問題?我們從去年5月份實踐就是要做個性化的信息提取,第一包括了用戶個人的信息空間,和他自己要檢索的信息空間,和我們這個社區(qū)里面已經(jīng)有的信息空間,在里面要做一些匹配,目前我們做了一些嘗試,首先看我們有什么樣的東西,就是在這種社交網(wǎng)絡(luò)里面有用戶的姓名,有他所在的國家或者地區(qū),有他所在的地域信息,其實這里面地域信息一個是通過IP地址自動提取的歸屬地在哪里,另外就是有年齡和性別,在Myspace我們還會要求用戶填他的性取向,其實在中國目前比較開放的國家,他填的還是蠻開放的,同性戀什么的也都會填上去,而且基本上也不會隱諱這些東西。用戶會來填寫自己的興趣和個性,是喜歡聽音樂,喜歡古典還是什么音樂,有些什么愛好,都是自己填出來。還有他會填自己受教育和工作的經(jīng)歷,在Myspace這種陌生人的交友網(wǎng)絡(luò)上填的相對小一些。比如像facebook,像國內(nèi)的校內(nèi)網(wǎng)用戶的信息就會填得很好,你幫他檢索所需要的人或者是內(nèi)容的時候,都會非常有用。他感興趣的群體這個是在Myspace填的很多的,就是你上來為了干什么,你為了結(jié)交什么樣的人?這是用戶自己所聲明的信息,這是我們作為用戶興趣顯性挖掘的時候,我們當(dāng)做顯性信息。

  還有其他隱性的東西就是這個用戶在上面交了什么樣的朋友,他的朋友都有什么樣的特性,我們通過這個都是能夠知道的。還有這些用戶自己都產(chǎn)生了什么樣的內(nèi)容,他說他自己上來是為了找音樂愛好者的,但是如果他整天看的都是美女圖,看的這些博客的內(nèi)容也都是在某一個另外的傾向上,我們可以認(rèn)為用戶自己聲稱的東西和實際的表現(xiàn)是有差別的,這是用戶的行為。這些用戶自己產(chǎn)生和消費的內(nèi)容,比如他讀了什么東西,寫了什么東西,他都看過什么樣的空間,他和朋友互動的時候,這里面用戶在社區(qū)里面經(jīng)常會碰到美女,認(rèn)識一下,交換一下QQ號,還有就是直接的問,你有沒有興趣我們晚上一起出去什么的,這種都會有,也是反映用戶的行為特性的,我們雖然說從隱私保護(hù)來講別的用戶不會知道這些信息,但是我們做后臺分析的時候這是能夠知道的,有多少人的興趣是一夜情,這個我們也是可以知道的。比如對廣告點擊的歷史也可能知道,他感興趣的內(nèi)容是什么,比如說現(xiàn)在投了三星的廣告,這個用戶是不是點擊了這個,點擊了這個,這個階段他對手機(jī)感興趣是相對比較大的。他安裝了一些什么樣的SNS,現(xiàn)在Myspace也是做了開放平臺,今年4月份的時候我們做的,在這西面用戶安裝了什么樣類型的也是一個隱含的信息,他喜歡展示類的還是喜歡和人去互動類的,還是安裝的是一個比較偏暴力的游戲,這些信息部分我們叫做隱性的挖掘,就是用戶隱性信息的挖掘,根據(jù)他的行為,不是他自己聲明的,是自己實際做的。

  這個項目是在去年5月份立項的,今年年初我們開始和國內(nèi)一家機(jī)構(gòu)進(jìn)行合作,這個方面也非常有意思,個性化信息檢索是我們國家自然科學(xué)基金一個項目,研究機(jī)構(gòu)有一個痛苦的地方,他們沒有用戶海量的數(shù)據(jù)和用戶行為的數(shù)據(jù),Myspace正好有這樣一個特點,我們和國內(nèi)一家科研機(jī)構(gòu)達(dá)成一個合作,由他們幫我們做一些基礎(chǔ)的科研,我們提取一部分用戶數(shù)據(jù)來作為科研輸入的東西,以及作為驗證的一些資料,同時我們自己有一個三四個人的團(tuán)隊,由他們來做商業(yè)化,就是怎么樣轉(zhuǎn)化到實際中的應(yīng)用,到后面大家會看到我們有一個系統(tǒng),是一個內(nèi)部使用的,在我們產(chǎn)品上實際上已經(jīng)投放了,在內(nèi)部要評估,叫做information for you。在這里面可以看到,這是inforU的截平,每個ID對照的是一個用戶,這個ID對照的用戶來說,我們這里面提取出來的可能會有的興趣,這個提取是顯示和隱性兩部分都有的,他自己聲明的是什么,他寫的博客是什么,目前還沒有加入到用戶人和人之間的互動,而是自己產(chǎn)生的內(nèi)容,他在博客里面寫的,和在論壇里面發(fā)的東西,我們提取他對什么感興趣,這個里面有閱讀、輪滑,喜歡電視,又練瑜珈,又看了《狼圖騰》這個書,這些東西其實在做用戶匹配的時候,給他推薦朋友的時候,我們現(xiàn)在在傳播的模塊里面有一個這個人你可能會認(rèn)識,或者這個人你會感興趣,給他推薦的時候會加上這樣的匹配。這里面有一個我們是同行,或者我們過去是同事,或者是同學(xué),這個比較多的是從顯性化里面的,他如果填了社交網(wǎng)絡(luò)可以填業(yè)緣。地緣我們是同一個城市的,或者我通過IP地址可以看到你是非常近的區(qū)域的,我和你所處的地理位置比較近,比如像一些群組里面,比較明顯的要做一些線下活動,給他推薦的地域至少是同一個城市,可能產(chǎn)生一些事情,這是地緣。音緣,Myspace在整個全球里面有980萬的音樂人,在中國雖然中國的本土音樂很少,但是畢竟音樂是Myspace的一個招牌,很多人上來也是為了聽歐美的音樂或者和音樂人有一些交往,音緣就是你們都是喜歡某種類型的音樂,我們會記錄用戶所有的音樂消費歷史,在空間的玩法里面,用戶為了找某一個音樂放在自己的空間里面當(dāng)做空間的背景音樂,大多數(shù)用戶都有這樣的選擇。他歷史上都選擇過什么樣的音樂,我們都是給他記錄下來的,叫做歌單,從這個歌曲來說,其實最后可以分出來,這個音樂是屬于什么類型的音樂。在音緣里面,給他推薦個性化信息的時候,這首歌你可能會喜歡,或者這個人他的音樂方面的愛好和你非常像,你愿不愿意看看是不是可以成為朋友。

  這是我們實際在產(chǎn)品里面的體現(xiàn),就是你可能認(rèn)識他們,但是這個產(chǎn)品的體驗做得還不是很好,我們馬上要推出的版本里面會直接告訴你為什么我推薦他。這是我們的一個問題,給他推薦了,但是沒告訴他為什么你可能會和這個人有緣,這里面的信息有,只是沒有把這個展現(xiàn)出來,在下一個版本里面這些東西就都會有的。

  這是Myspace日本的手機(jī)客戶端,Myspace在全球里面,在手機(jī)上做得最好的是Myspace日本,美國目前Myspace.com所做的產(chǎn)品,基本上就是把Web上的功能引到手機(jī)上,就是所有的功能都可以有,但是用戶的使用體驗的確用起來不是很方便。包括Myspace中國我們是把Iphone也開發(fā)出來了,應(yīng)該這幾天就可以發(fā)布。這個版也是繼承了美國的風(fēng)格,就是僅僅是完成了所有的功能,功能很全,我們估計中國用戶用的時候不是很方便。像剛才說的我們的推薦,這部分內(nèi)容也沒有帶進(jìn)去,第一個版本也沒有帶進(jìn)去,但是下面會集成進(jìn)去,第一個我們當(dāng)做練手的Iphone,下面會往手機(jī)平臺上做。這是Myspace最新的一些消息,這是網(wǎng)站推薦的內(nèi)容,這是網(wǎng)站推薦的人,還有這些朋友請求,這個版本比較多的就是功能性的,在這里面可以看到有音樂內(nèi)容,可以給你推薦音樂內(nèi)容,允許用戶對別人進(jìn)行評價,這邊是做廣告的,這里面在Myspace Japan里面會有TV,在中國TV是進(jìn)不來的。這是要找某一個音樂人的界面,這是對于用戶的空間來進(jìn)行評級,對音樂來進(jìn)行評級,對于視頻進(jìn)行評級,這部分的東西一個是和搜索相關(guān),另外就是和方式相關(guān)。在這里面有非常大的改進(jìn)空間,可以做個性化的,根據(jù)用戶過去消費的歷史進(jìn)行匹配。

  回過頭來做一個總結(jié),個性化信息檢索目前處于一個什么階段?個性化信息檢索,研究的開始其實在上個世紀(jì)的80年代就開始的,包括斯坦福、卡內(nèi)基梅隴、微軟的美國研究院,以及國內(nèi)的北大研究室,復(fù)旦大學(xué)、中科院計算所、哈爾濱工業(yè)大學(xué)等等這些研究機(jī)構(gòu)或者是學(xué)校,其實早就開始在做個性化信息的檢索。但是真正的個性化信息檢索開始引起足夠的重視,比如說進(jìn)入到國家自然科學(xué)基金應(yīng)該是去年到今年的事情,而研究機(jī)構(gòu)在這方面其實是面臨著很大的困難,經(jīng)費還是小事,最主要的沒有數(shù)據(jù),而這方面的研究,其實大量的要靠樣本,原有的數(shù)據(jù)拿過來做模型,看這個模型訓(xùn)練的結(jié)果,最后再看評估體系,往往還是加上是人介入的。就是一般的比如編輯拿過來,用人工來判定,人工來判定當(dāng)做一個學(xué)習(xí)的資料去學(xué),再由人工判定的資料做一個自動的判定,最后往往還有大量人工的判定,檢測模型的效果,不行的話再進(jìn)行調(diào)整,這是用的主流的方法之一。在這里面包括了要建用戶檢索的信息空間模型,在做這種個性化信息檢索里面,還會挖掘人和人之間的關(guān)系,挖掘人的社會屬性,他的朋友是什么樣子的,他的朋友的信息也會當(dāng)做他檢索模型里面的信息要推送過來。同時最后還會做一些協(xié)同過濾方面的東西,就是和他相似的這些人檢索信息的時候有什么樣的特色,最終也會當(dāng)做他所檢索信息的一些屬性進(jìn)來。就是他的朋友以及系統(tǒng)給他自動聚類出來的,這些人他們可能在現(xiàn)實生活當(dāng)中不認(rèn)識,但是他們檢索信息的模式非常相近,這部分也會當(dāng)做檢索信息的內(nèi)容給出來。目前還是一個非常初級的階段,在Myspace的產(chǎn)品里面,我們目前僅僅是用到了推薦朋友,給他推薦新朋友,第二個是閱讀博客,或者閱讀論壇的時候,尤其是閱讀博客的時候,會給他再推薦一些其他的內(nèi)容,用到內(nèi)容推薦,這是目前非常初步的應(yīng)用。

  預(yù)計在明年年初的時候,我們和科研機(jī)構(gòu)第一期會出來一些成果,這些成果出來之后,會繼續(xù)的用在網(wǎng)站和手機(jī)版的推薦上面,應(yīng)該會再往前走一步。當(dāng)然真正從科研項目來說,時間是五年,我們還有四年時間,只是一個初步的,所以它仍然在發(fā)展。但是在企業(yè)上,在商業(yè)上的應(yīng)用應(yīng)該是已經(jīng)基本上能夠用了,成熟期還談不上,但是應(yīng)該是可以用了。存在的問題就是潛在有隱私的問題,當(dāng)這個研究目的,比如說用戶的數(shù)據(jù)我們拿出去做分析,簽有關(guān)的保密協(xié)議等等這些東西,在中國畢竟用戶的隱私大家還不是那么在意,如果這個事在美國的話弄不好可能會被告了,但是做一個研究也是很無奈的事情。對于它的前景來說,我個人是非常看好的,因為它存在非常大的需求,讓用戶很快的找到信息,用戶的方便性。中國之所以能夠樹立一個非常高的互聯(lián)網(wǎng)的門檻,跨國的互聯(lián)網(wǎng)公司進(jìn)來很多發(fā)展的不是很順利,和用戶的使用心理有很大的關(guān)系,中國的互聯(lián)網(wǎng)用戶非常懶,而且不主動,如果你不能夠主動的把信息推到他的面前去看,讓他尋找去學(xué)習(xí)的話就非常難以成功。我們?nèi)ツ戤?dāng)時發(fā)布Myspace是原汁原味的產(chǎn)品,結(jié)果我們被罵得狗血淋頭,磚頭真的是滿天飛,有一個月時間我們壓力特別大,這也是中國互聯(lián)網(wǎng)公司的機(jī)會,因為它直接拷貝進(jìn)來的話非常難以成功,Google是另外一個特例,Google的搜索之類的東西其實是非常簡化了,但是如果在社區(qū)上面,在中國絕對需要這個方面的創(chuàng)新。目前我們做的個性化信息檢索項目不是Myspace全球做的,僅僅是Myspace中國自己開始的一個項目,在這方面是能夠提高用戶體驗的一個方式。

  我的演講就到這里,謝謝大家,謝謝主持人,祝大家中午有一個好胃口。

搜狐IT



相關(guān)鏈接:
NTT Docomo張永生:移動SNS的個性化與管理 2008-12-19
廣電總局易凱:手機(jī)電視的運營管理和應(yīng)用 2008-12-19
聯(lián)想移動梁軍:移動寬帶互聯(lián)網(wǎng)的未來 2008-12-19
谷歌中國總裁李開復(fù):移動搜索精準(zhǔn)至關(guān)重要 2008-12-19
閔昊:應(yīng)用于手機(jī)移動支付的硬件方案QSIM 2008-12-19

分類信息:     熱點專題_移動增值_文摘   行業(yè)_移動_文摘