現(xiàn)代的云數(shù)據(jù)中心有數(shù)以百計(jì)的服務(wù)器,上面運(yùn)行著上千個(gè)虛擬機(jī),還有各種網(wǎng)絡(luò)設(shè)備和存儲(chǔ),管理運(yùn)營(yíng)數(shù)據(jù)中心是一個(gè)挑戰(zhàn):需要監(jiān)控的對(duì)象超出人力所及的范圍,需要分析的報(bào)警數(shù)據(jù)根本來(lái)不及處理。在這樣的壓力下,管理員疲于奔命,被動(dòng)式地響應(yīng)服務(wù)請(qǐng)求,累得跟狗一樣還總是有人報(bào)怨故障解決得太慢,IT民工咋那么命苦呢?別著急,vRealize Operations就是改變廣大運(yùn)營(yíng)維人員命運(yùn)的一款神器。
保證服務(wù)質(zhì)量
vROps會(huì)代替管理員監(jiān)控?cái)?shù)據(jù)中心內(nèi)的所有設(shè)備,而且是24小時(shí)不間斷地,不會(huì)漏掉任何報(bào)警信息。但是它不會(huì)簡(jiǎn)單地把收到的信息直接呈現(xiàn)給管理員,而是進(jìn)過(guò)整理和分析之后進(jìn)行總結(jié),過(guò)濾掉關(guān)于同一故障的大量冗余信息,最后以三個(gè)非常簡(jiǎn)單的超級(jí)指標(biāo)形式展現(xiàn):健康狀況、系統(tǒng)風(fēng)險(xiǎn)、運(yùn)行效率。管理員通過(guò)vROps及時(shí)發(fā)現(xiàn)和解決問(wèn)題,采取措施預(yù)防潛在風(fēng)險(xiǎn)和提高運(yùn)行效率,來(lái)保證整個(gè)數(shù)據(jù)中心的服務(wù)質(zhì)量等級(jí)SLA。
vROps會(huì)根據(jù)歷史數(shù)據(jù)進(jìn)行分析,對(duì)系統(tǒng)的性能和風(fēng)險(xiǎn)作出智能預(yù)測(cè),最后通過(guò)超級(jí)指標(biāo)提示管理員。神奇的是,vROps不但通能指出問(wèn)題所在,而且能進(jìn)一步給出整改意見(jiàn)。
舉個(gè)栗子:在下圖中,vROps顯示“健康”和“風(fēng)險(xiǎn)”這兩項(xiàng)指標(biāo)都有問(wèn)題,管理員就應(yīng)該看一下每個(gè)指標(biāo)下的詳細(xì)信息。“健康”指標(biāo)下的第一條警告顯示有些虛擬機(jī)由于快像太多而導(dǎo)致磁盤(pán)I/O延遲問(wèn)題,點(diǎn)開(kāi)后就可以看到進(jìn)一步的詳細(xì)指示:刪除多余的快像,把多余的快像合并成一個(gè)。管理員按照指示采取相應(yīng)的操作之后,就可以消除這一系統(tǒng)性能問(wèn)題。
漲姿勢(shì):虛機(jī)的數(shù)據(jù)存放在虛機(jī)的鏡像文件中,虛機(jī)的快像(snapshot)實(shí)際上是把虛機(jī)目前的狀態(tài)跟原鏡像之間的差異保存在一個(gè)delta文件中。當(dāng)虛機(jī)有多個(gè)快像時(shí),就有多個(gè)對(duì)應(yīng)的delta文件存在,每個(gè)delta文件記錄跟前一個(gè)虛機(jī)狀態(tài)之間的差異,虛機(jī)當(dāng)前的數(shù)據(jù)是由所有這些delta文件和原鏡像疊加計(jì)算出來(lái)的。所以虛機(jī)的鏡像不宜太多,不然會(huì)嚴(yán)重降低系統(tǒng)性能,刪除一些不必要的快像可以減輕文件讀寫(xiě)負(fù)擔(dān),提高系統(tǒng)性能。
提高運(yùn)營(yíng)效率
從上面的例子可以看到,vROps不僅可以幫助快速定位問(wèn)題,還能指導(dǎo)管理員迅速解決問(wèn)題。據(jù)統(tǒng)計(jì),vROps可以減少大約50%的排錯(cuò)時(shí)間,從而大大減少管理員的工作負(fù)擔(dān),好讓他們也有時(shí)間去陪妹紙呀。
為了防止容量不夠而引起故障,應(yīng)用部門(mén)在申請(qǐng)?zhí)摍C(jī)容量時(shí)往往向上靠,又導(dǎo)致了容量的過(guò)量分配。盡管VMware也提供了Thin Provision的虛擬硬盤(pán)分配選項(xiàng),但是在服務(wù)器中經(jīng)常選擇性能更優(yōu)的Thick Provision,過(guò)量分配就會(huì)占用大量的硬盤(pán)空間。另一方面,有些虛擬機(jī)用完以后也沒(méi)有被及時(shí)注銷,數(shù)據(jù)中心每隔一段時(shí)間就會(huì)出現(xiàn)僵尸虛機(jī),也占用著寶貴的內(nèi)存和存儲(chǔ)空間。
vROps提供了容量分析工具來(lái)讓管理員定期檢查系統(tǒng)資源的使用情況,一旦發(fā)現(xiàn)資源不足(超出警戒線)或是過(guò)量分配的情況,就能及時(shí)采取措施,來(lái)化解資源短缺的險(xiǎn)情,回收過(guò)量分配的資源。這么做一方面可以有效防止因?yàn)橘Y源短缺而引起的故障風(fēng)險(xiǎn),另一方面也可以有效利用現(xiàn)有的硬件資源,降低數(shù)據(jù)中心的硬件采購(gòu)成本。
在啟動(dòng)新項(xiàng)目之前,管理員可以使用vROps來(lái)針對(duì)容量進(jìn)行What-If假設(shè)分析,看看現(xiàn)有的容量是否能滿足新項(xiàng)目的需求。如果容量不夠的話,可以規(guī)劃一下需要加入多少新的服務(wù)器或存儲(chǔ)才能滿足新增需求;也可以查找可回收的資源,計(jì)算一下這些資源回收以后能否滿足需求。
漲姿勢(shì):vSphere在創(chuàng)建虛機(jī)時(shí)虛擬硬盤(pán)有三種格式可以選擇:
Thick Provision Lazy Zeroed
一開(kāi)始就分配足額空間給虛擬硬盤(pán),但是等真正寫(xiě)入數(shù)據(jù)時(shí)才初始化(寫(xiě)0);
一開(kāi)始就分配足額空間給虛擬硬盤(pán),但是等真正寫(xiě)入數(shù)據(jù)時(shí)才初始化(寫(xiě)0);
Thick Provision Eager Zeroed
一開(kāi)始就分配足額空間給虛擬硬盤(pán),并且完全初始化(寫(xiě)0),性能最優(yōu);
一開(kāi)始就分配足額空間給虛擬硬盤(pán),并且完全初始化(寫(xiě)0),性能最優(yōu);
Thin Provision
根據(jù)虛擬硬盤(pán)的實(shí)際使用來(lái)分配空間,但在性能上要比上面兩種差一些。
根據(jù)虛擬硬盤(pán)的實(shí)際使用來(lái)分配空間,但在性能上要比上面兩種差一些。
控制和合規(guī)
出于安全、性能和管理等方面的要求,每個(gè)數(shù)據(jù)中心都有一系列的規(guī)章制度。舉個(gè)栗子:DCUI(Direct Console UserInterface)是vSphere在每臺(tái)物理服務(wù)器上的管理界面,它有一個(gè)LoginIdle Timeout參數(shù)一定要設(shè)置(建議設(shè)成10分鐘),不然管理員忘記Logout就走開(kāi)了,碰到惡意搞破壞的壞人就會(huì)有安全隱患。
類似這樣的安全強(qiáng)制條例可能有上百條,數(shù)據(jù)中心的每一臺(tái)設(shè)備都要求符合這些規(guī)定。讓管理員一臺(tái)一臺(tái)去檢查嗎?別逗了,那別的工作什么都不用干了。vROps可以自動(dòng)檢查數(shù)據(jù)中心里所有設(shè)備的合規(guī)性(Compliance),把不合規(guī)的情況一條條列出來(lái),管理員可以隨后手工改正這些問(wèn)題,也可以讓vROps強(qiáng)制(Hardening)修正。
大家可能也聽(tīng)說(shuō)過(guò)VMware的另一個(gè)監(jiān)控工具vRealize LogInsight,vROps跟它是什么關(guān)系呢?vROps跟LogInsight是這樣分工的,vROps負(fù)責(zé)收集和監(jiān)控結(jié)構(gòu)化的數(shù)據(jù),包括各種系統(tǒng)指標(biāo)、告警、事件等;LogInsight負(fù)責(zé)收集和監(jiān)控非結(jié)構(gòu)化的數(shù)據(jù)—所有的文本日志,這些日志分布在多個(gè)設(shè)備和服務(wù)中,由LogInsight來(lái)把它們收集到一起,這樣管理員就可以在一個(gè)地方看到所有的日志。兩個(gè)工具一起協(xié)作來(lái)共同支持?jǐn)?shù)據(jù)中心中的運(yùn)營(yíng)管理工作,實(shí)際上vROps和LogInsight也是所有vRealize套件產(chǎn)品中的基礎(chǔ)組件。
通過(guò)上面的介紹大家可以看到vROps有這么強(qiáng)的管理功能,有了這樣一個(gè)工具的幫助,云數(shù)據(jù)中心的管理工作就不再是MissionImpossible。
漲姿勢(shì):vRealize產(chǎn)品家族
VMware把云管平臺(tái)產(chǎn)品家族命名為vRealize,包括4個(gè)主要產(chǎn)品:
- vRealize Business,IT資源成本核算
- vRealize Automation,自動(dòng)化部署IT服務(wù)
- vRealize Operations,監(jiān)控運(yùn)營(yíng)數(shù)據(jù)中心
- vRealize LogInsight,日志管理平臺(tái)
另外,也有以上幾個(gè)產(chǎn)品組合在一起的套件產(chǎn)品vRealize Suite,分成標(biāo)準(zhǔn)版、高級(jí)級(jí)和企業(yè)版三個(gè)不同等級(jí)的版本。