12月13日消息,在由云基地主辦的“中關(guān)村大數(shù)據(jù)日”活動(dòng)上,中國聯(lián)通研究院副院長黃文良介紹,“今年,中國聯(lián)通成功將大數(shù)據(jù)和Hadoop技術(shù)引入到‘移動(dòng)通信用戶上網(wǎng)記錄集中查詢與分析支撐系統(tǒng)’。截止到目前,我們已經(jīng)部署了4.5PB的存儲(chǔ)空間。其中,4.5PB的存儲(chǔ)分布在300個(gè)數(shù)據(jù)節(jié)點(diǎn)上,即每個(gè)節(jié)點(diǎn)配備15TB的存儲(chǔ)空間。如此一來,系統(tǒng)每天有能力處理700億條上網(wǎng)記錄。”
中國聯(lián)通對(duì)大數(shù)據(jù)的探索源自于2010年中國聯(lián)通數(shù)據(jù)大集中策略的提出。2009年,中國聯(lián)通3G業(yè)務(wù)正式商用,提出“統(tǒng)一品牌、統(tǒng)一業(yè)務(wù)、統(tǒng)一包裝、統(tǒng)一資費(fèi)、統(tǒng)一終端政策、統(tǒng)一服務(wù)標(biāo)準(zhǔn)”的“六個(gè)統(tǒng)一”策略。這意味著中國聯(lián)通要走一條數(shù)據(jù)大集中的路線。
然而,數(shù)據(jù)大集中將使得中國聯(lián)通面臨著不少挑戰(zhàn)。中國聯(lián)通信息化部總經(jīng)理柳博亮曾在公開演講中指出挑戰(zhàn)來自五個(gè)方面,分別是大用戶量下的集中系統(tǒng)的處理能力,如何快速實(shí)現(xiàn)對(duì)市場變化需求的響應(yīng),支撐業(yè)務(wù)運(yùn)營的可靠性,與個(gè)性化業(yè)務(wù)的支持能力以及集中環(huán)境下的運(yùn)維體系。
適逢大數(shù)據(jù)的出現(xiàn),為聯(lián)通應(yīng)對(duì)這些挑戰(zhàn)找到了一條途徑。2010年,中國聯(lián)通開始著手大集中的數(shù)據(jù)中心建設(shè),同期引入Hadoop技術(shù)。目前,Hadoop被成功部署到中國聯(lián)通的“移動(dòng)通信用戶上網(wǎng)記錄集中查詢與分析支撐系統(tǒng)”。
黃文良表示,“我們之前很擔(dān)心一旦數(shù)據(jù)大集中,會(huì)出現(xiàn)用戶查詢響應(yīng)速度慢等問題,從而影響用戶感知。顯然,這對(duì)于保持用戶黏性顯然是不利的。如今引入Hadoop技術(shù)后,假如用戶查詢上網(wǎng)記錄,系統(tǒng)在1秒內(nèi)便可呈現(xiàn)數(shù)據(jù)。”
“我們確確實(shí)實(shí)體會(huì)到,自己是分布式計(jì)算的受益者,是非結(jié)構(gòu)化數(shù)據(jù)庫的受益者,更是大數(shù)據(jù)的受益者。”黃文良在本次活動(dòng)上獲得“大數(shù)據(jù)最佳實(shí)踐獎(jiǎng)”之際由衷地說道。
其實(shí)中國聯(lián)通并不是唯一一家吃“螃蟹”的運(yùn)營商。中國移動(dòng)可是說是國內(nèi)最早開始Hadoop技術(shù)研發(fā)的運(yùn)營商。2007年3月,中國移動(dòng)啟動(dòng)“大云”計(jì)劃,當(dāng)年7月,便利用閑置資源搭建第一個(gè)Hadoop平臺(tái)。而在中國移動(dòng)“大云”1.5產(chǎn)品總體架構(gòu)中,分析型PaaS產(chǎn)品底層便是基于Hadoop數(shù)據(jù)存儲(chǔ)和分析平臺(tái)。目前,中國電信也正在進(jìn)行大數(shù)據(jù)技術(shù)的實(shí)驗(yàn)室研究工作。