中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當前的位置是:  首頁 > 新聞 > 國內(nèi) >
 首頁 > 新聞 > 國內(nèi) >

零宕機方案 vSphere Fault Tolerance

2016-12-14 11:33:31   作者:   來源:CTI論壇   評論:0  點擊:


  Google 的工程師大牛 Jeff Dean 說過:“如果你有一萬臺計算機在運行,那么每天一定會有電腦死機發(fā)生。”事實上的確如此,無論服務(wù)器設(shè)計得有多可靠,總是有宕機的可能性存在,哪怕是 IBM 號稱永不宕機的大型機 (z 系列主機,z 代表 zero down time)。所以數(shù)據(jù)中心的管理員們一直在尋找提高系統(tǒng)可靠性的解決方案,最常見的就是雙機熱備方案。
  VMware vCenter 就能夠提供高可靠的集群 (Cluster) 方案,在 vSphere 集群中,任何一臺服務(wù)器發(fā)生嚴重故障了(如系統(tǒng)宕機、網(wǎng)絡(luò)故障、存儲失聯(lián)等),上面運行的工作負載就會被 vCenter 轉(zhuǎn)移到其他正常運行的服務(wù)器繼續(xù)運行。這種高可靠架構(gòu)可以滿足絕大多數(shù)業(yè)務(wù)的需求,在共享存儲或 vSAN 上都能實現(xiàn) RPO=0 的效果,但是需要一點時間在其他服務(wù)器上重啟相關(guān)應(yīng)用和服務(wù),所以 RTO>0。
  漲姿勢:RTO 和 RPO
  在設(shè)計高可靠系統(tǒng)時經(jīng)常涉及到 RTO 和 RPO 兩個指標:
  • RTO (Recovery Time Objective) 就是企業(yè)能容忍的恢復(fù)時間。災(zāi)難發(fā)生后,從 IT 系統(tǒng)宕機導(dǎo)致業(yè)務(wù)停頓,到 IT 系統(tǒng)恢復(fù)至可以恢復(fù)業(yè)務(wù)運營之間的時間。
  • RPO (Recovery Point Objective) 可簡單地描述為企業(yè)能容忍的最大數(shù)據(jù)丟失量。假設(shè)系統(tǒng)一天做一次備份,如果第二天出現(xiàn)錯誤,那從備份完成后到錯誤出現(xiàn)時所寫入的數(shù)據(jù)都無法挽回了,從上一次備份到發(fā)生錯誤之間的時間就是 RPO。
  但是還是有一部分關(guān)鍵應(yīng)用不允許有任何中斷,要求達到 RTO=0 的高可靠性,這時候就可以采用 vSphere Fault Tolerance 容錯技術(shù)。
  FT 工作原理
  FT 技術(shù)的工作原理是把需要保護的虛機運行在主服務(wù)器上,指定集群中的另一臺服務(wù)器為備份,vSphere 在備份服務(wù)器上也創(chuàng)建一個跟受保護虛機一模一樣的虛機。主虛機和備份虛機的數(shù)據(jù)和狀態(tài)是完全一致的,通過 vLockStep (virtual Lockstep) 技術(shù)來保證兩臺虛機的同步運行。vSphere 通過網(wǎng)絡(luò)把主虛機的 FT 日志 (FT Logging) 傳遞給備份虛機,保證兩臺虛機在同一時間內(nèi)處理相同的指令,并且處理相同的非確定性事件,如網(wǎng)絡(luò)數(shù)據(jù)包、用戶輸入、硬件時鐘等,這些非確定性事件在物理機上幾乎是無法同步的,但是虛機的所有硬件和 I/O 輸入都是由 vSphere 來控制的,所以就可以做到。
  漲姿勢:Lockstep 技術(shù)
  Lockstep 技術(shù)是容錯計算機 (Fault Tolerance Computer) 的關(guān)鍵實現(xiàn)技術(shù)之一,通過使用相同的、冗余的硬件組件來保持多個 CPU、內(nèi)存精確的同步,在正確的相同時鐘周期內(nèi)執(zhí)行相同的指令。該技術(shù)能夠保證發(fā)現(xiàn)任何錯誤,即使短暫的錯誤,系統(tǒng)也能在不間斷處理和不損失數(shù)據(jù)的情況下恢復(fù)正常運行。
  vSphere 把發(fā)送給主虛機的網(wǎng)絡(luò)數(shù)據(jù)包也完全復(fù)制給備份虛機,備份虛機執(zhí)行跟主虛機完全一致的指令流,按照相同的順序來對網(wǎng)絡(luò)服務(wù)請求做出響應(yīng),產(chǎn)生完全一致的運算結(jié)果。唯一的區(qū)別在于,主虛機對外的輸出是實際生效的,磁盤寫操作會提交給硬盤、網(wǎng)絡(luò)數(shù)據(jù)包會被發(fā)送出去;備份虛機的所有對外輸出都會被 vSphere 屏蔽,外界不會感知到備份虛機的存在。
\
  只有當主虛機失效時 (主服務(wù)發(fā)生故障),備份虛機才會真正生效。因為兩個虛機的 CPU 指令順列、內(nèi)存狀態(tài)都是完全一致的,vSphere 馬上進行故障轉(zhuǎn)移 (failover),即刻讓備份虛機變成新的主虛機, 所有的 TCP 網(wǎng)絡(luò)連接都沒有中斷,虛機中的應(yīng)用可以繼續(xù)運行。對外界用戶而言,受保護的虛機完全沒有中斷運行,實現(xiàn)了 RPO=0 和 RTO=0 的最高等級容錯。為了繼續(xù)保護新的主虛機,vSphere 會在集群中尋找一臺合適的服務(wù)器作為新的備份服務(wù)器,然后在上面復(fù)制一個新的備份虛機出來,從而形成新的容錯保護機制。
\
  換一個角度,我們也可以把 FT 技術(shù)看作是一種特殊的 vMotion。vMotion 的過程是把虛機的內(nèi)存逐塊地復(fù)制到另一臺服務(wù)器上,在復(fù)制的過程中虛機還在正常運行,所以內(nèi)存還在被不斷的改寫,最后一塊被復(fù)制的內(nèi)存被稱之 vMotion checkpoint,這塊內(nèi)存復(fù)制完成之后虛機就被完全切換到新的服務(wù)器上運行,從而完成 vMotion 的整個過程。FT 技術(shù)則是持續(xù)地復(fù)制 checkpoint 內(nèi)存塊,正常情況下并不結(jié)束這一操作,只有當故障轉(zhuǎn)移時,才真正完成 vMotion 操作。
  FT 適用條件
  FT 技術(shù)不要求對應(yīng)用進行改寫,或是對操作系統(tǒng)進行特殊的配置,所以一般的應(yīng)用可以很方便地使用 FT 技術(shù)來進行保護。vSphere 6.0 可以保護的虛機最多可以有 4 個 vCPU、64 GB 內(nèi)存,不超過這個資源限制的應(yīng)用都可以采用 FT 技術(shù)來保護。而且這是 vSphere 標準版就內(nèi)置的功能,不用采購額外的軟件許可證,凡是 vSphere 的用戶都可以隨時激活對于虛機的 FT 保護。
  FT 的工作機制要求主備虛機之間進行同步,只有等備份虛機上的同步操作完成之后,主虛機上的數(shù)據(jù)包傳輸才會真正完成。對于網(wǎng)絡(luò)上的用戶而言,發(fā)給主虛機的網(wǎng)絡(luò)請求就有一個額外的延遲,一般這個延遲從幾毫秒到幾百毫秒不等,一個低速的 FT 日志同步網(wǎng)絡(luò)(如1GB)可能加劇這種等待,搭建 vSphere FT 環(huán)境要求主備服務(wù)器之間是專用的 10GB 高速低延遲同步網(wǎng)絡(luò),以保證主備服務(wù)器之間的 FT 日志同步速度,否則就會給受保護的應(yīng)用帶來嚴重的性能影響。所以 FT 技術(shù)不適用于對于延遲敏感的應(yīng)用或者是實時應(yīng)用,也不適用于對于內(nèi)存進行大量修改的應(yīng)用(因為會產(chǎn)生大量的 FT 日志同步)。
  傳統(tǒng)的容錯計算是由昂貴的專用服務(wù)器實現(xiàn)的,現(xiàn)在 vSphere 在普通的 x86 服務(wù)器上就能實現(xiàn)同樣的功能,容錯計算終于成為一種大家都用得起的技術(shù)。

相關(guān)熱詞搜索: VMware vCenter 零宕機

上一篇:Asterisk課堂-IAX2 介紹

下一篇:最后一頁

專題