場(chǎng)景三 “ 慢動(dòng)作 ” 的游戲
“ 老板,過去一周有 100 多個(gè)核心玩家說咱的游戲體驗(yàn)不好,經(jīng)常卡頓,沒法玩下去了。”
“ 什么 ?這可不行。小王,你告訴我到底是哪里出問題了?”
沒有 ThousandEyes 的情況下…
“ 我們不僅有自建數(shù)據(jù)中心,也已經(jīng)盡力買了各個(gè)地方最好的 CDN 和公有云服務(wù)了,阿里云,Azure ,Google 云和 AWS 都上了。涉及這么多家,很難查?”
“ 那怎么辦?”
“ 要不我們?cè)贁U(kuò)一擴(kuò)帶寬?或者買IOPS更好的服務(wù)器資源?”
“ 那不是又要提高成本嘛 ”
“ 這也是沒有辦法的辦法…”
有 ThousandEyes 的情況下…
“ 老板等一下。ThousandsEyes 控制面板里說,海外玩家受到***供應(yīng)商DNS故障的影響 ;國(guó)內(nèi)南方城市的玩家受多處線路影響,估計(jì)跟洪水險(xiǎn)情有關(guān)系。”
“ 有明確的故障信息嗎?”
“ 我們已經(jīng)和這些服務(wù)商分享了 ThousandsEyes 提供的故障報(bào)告,正在電話聯(lián)系他們盡快處理。”
“ 要等多長(zhǎng)時(shí)間?我們需要第一時(shí)間發(fā)布游戲服務(wù)的故障公告!”
五分鐘后……
“ 老板,這幾家供應(yīng)商已郵件確認(rèn)我們的故障反饋,可以發(fā)游戲公告了 ”
ThousandEyes 是如何做到的呢?
ThousandsEyes 的 Cloud Agent ( 預(yù)安裝的云上代理 ) 是可以在各運(yùn)營(yíng)商、公有云里預(yù)部署的診斷組件。ThousandsEyes目前已在全球部署了191個(gè) IPv4 Cloud Agent、76 個(gè) IPv6 Cloud Agent,與全球 Tier1/2/3 ISP 直接相連,比如國(guó)內(nèi)的電信、聯(lián)通等。此外,全球微軟 Azure 云 25 個(gè) Region、Google 云的 17 個(gè) Region、AWS的15 個(gè) Region、阿里云的 19 個(gè) Region 上均部署了Cloud Agent。這些 Agent 數(shù)量、位置,還在持續(xù)增加(見下圖)。
如果您的企業(yè)對(duì)外提供服務(wù),不管是基于私有云還是混合云部署,都可以在全球不同位置通過 Enterprise Agent 、 Cloud Agent ,監(jiān)控這些服務(wù)對(duì)于全球不同位置訪客的訪問體驗(yàn)。
如果您的企業(yè)為員工購(gòu)買第三方公有云服務(wù),包括 SaaS 服務(wù),可以基于 Endpoint Agent (安裝在 PC 機(jī)上的代理)監(jiān)控員工的訪問體驗(yàn),也可以基于 Enterprise Agent、Cloud Agent 監(jiān)控各自區(qū)域訪問這些服務(wù)的體驗(yàn) ;
可供配置的監(jiān)控任務(wù)多種多樣:
- 監(jiān)控 BGP ,幫助分析路由故障根因,檢查全路徑節(jié)點(diǎn)和線路質(zhì)量,包括節(jié)點(diǎn)間多路徑情況。官網(wǎng)也有多個(gè) Internet BGP 大網(wǎng)故障事件的監(jiān)控、分析報(bào)告,大家可以參考。
- 網(wǎng)絡(luò)監(jiān)控: Network 類型里可以監(jiān)控 Agent 到服務(wù)的情況,這在前面的事例里面已經(jīng)看到效果;也可以監(jiān)控 Agent 到 Agent 的雙向情況,這允許您充分發(fā)揮想象力以實(shí)現(xiàn)多種多樣的監(jiān)控效果。
- DNS 監(jiān)控 :可以創(chuàng)建啟用所有 Agent 對(duì) DNS 做豐富的檢測(cè)。
- Web 監(jiān)控:以在線購(gòu)物為例,可以模擬賬戶登錄后的操作以實(shí)現(xiàn)對(duì) Transaction ( 交易 ) 類型的監(jiān)控。
- 語音監(jiān)控:針對(duì)語音部分,也提供多種監(jiān)控方式,可以針對(duì)SIP Server、RTP 流、VOIP 呼叫,包括“ Skype for Business ”。
場(chǎng)景四 故障復(fù)盤愁死人
企業(yè) A 最近剛開始上 SD-WAN ,但吃不準(zhǔn)廠商的解決方案是不是最優(yōu)的。
“小王啊,我們最近上了 SD-WAN 效果怎么樣?錢是省了,網(wǎng)絡(luò)速度降低的多不多?不知道是不是要換一家試試?”
沒有 ThousandEyes 的情況下
“ 感覺還可以,沒有明顯問題 ”
“ 什么叫感覺還可以?你有數(shù)據(jù)嘛?”
“我可以找個(gè)測(cè)試軟件找找時(shí)間切面上的速度情況…”
“ 那能有多準(zhǔn)確??而且發(fā)現(xiàn)性能不好能定位故障嗎?”
有 ThousandEyes 的情況下…
“ 老板放心,準(zhǔn)得很。ThousandsEyes 能同時(shí)看到底層網(wǎng)絡(luò)和 SD-WAN 的性能表現(xiàn) 。不僅能知其然,還能知其所以然。”
ThousandEyes 是如何做到的呢?
SD -WAN 是一個(gè) “ 網(wǎng)絡(luò)上面創(chuàng)建網(wǎng)絡(luò) ” 的場(chǎng)景, 前者是運(yùn)營(yíng)商的專線 /internet 線路等,后者是企業(yè)互聯(lián)各分支的“ 虛擬的網(wǎng)絡(luò) ”,前者是底層 /underlay 而后者是虛擬隧道 /overlay,這樣復(fù)雜的網(wǎng)絡(luò)模型,ThousandEyes 是如何做到性能監(jiān)控的呢?
如下是一個(gè)真實(shí)的客戶案例 : 該客戶基于運(yùn)營(yíng)商 MPLS 的線路搭建企業(yè) SD-WAN 網(wǎng)絡(luò)。
此圖是基于不同類型 Agent 通過 ThousandEyes 平臺(tái)創(chuàng)建不同類型的 Test (測(cè)試):比如基于 Cloud 或 Enterprise Agent 測(cè)試 underlay MPLS 線路網(wǎng)絡(luò)質(zhì)量、比如安裝在 SD-WAN 內(nèi)的 Enterprise Agent 之間可以互測(cè)以便提供Overlay 虛擬通道的網(wǎng)絡(luò)質(zhì)量和網(wǎng)絡(luò)吞吐 (比如分支與總部各部署一個(gè) Agent ) ;
創(chuàng)建種類豐富的 Test (測(cè)試) 后,即可按需制作各種類型的Dashboard (監(jiān)控大屏),比如私有云服務(wù)、SaaS 應(yīng)用服務(wù)、Web 服務(wù)、不同區(qū)域、網(wǎng)絡(luò)性能、不同運(yùn)營(yíng)商線路等等;這在 SD-WAN 整體運(yùn)營(yíng)中非常重要。
在該案例中,10 月 12~ 18號(hào)期間,芝加哥分支不管訪問哪一個(gè) SaaS 服務(wù),都出現(xiàn)持續(xù)高延時(shí) ;
而芝加哥地區(qū)的運(yùn)營(yíng)商線路監(jiān)控顯示,AT & T線路存在高時(shí)延 :
點(diǎn)開路徑可視化即可發(fā)現(xiàn)此時(shí)的 AT & T與 Microsoft 的 Ingress節(jié)點(diǎn)之間 ( BGP Peering ) 可能出現(xiàn)了某類故障。整個(gè)路徑上,延遲超過 60 毫秒的為紅色 MPLS tunnel ,貢獻(xiàn)了 105 毫秒的高延時(shí) ;
這就是從上到下的整體復(fù)盤能力,該案例中可以將運(yùn)維畫面 ( 監(jiān)控畫面的網(wǎng)址 ) 分享給對(duì)應(yīng)的服務(wù)商,快速定位故障點(diǎn)!
ThousandEyes 這一綜合運(yùn)維的能力,幫助企業(yè)提供底層 Underlay、上層 SDWAN overlay 及企業(yè)應(yīng)用的全面而可視化的綜合體驗(yàn),幫助企業(yè)IT提供全面可視化的精細(xì)運(yùn)維提升企業(yè)生產(chǎn)力!
總結(jié)
ThousandEyes基于代理工作機(jī)制,通過Endpoint、Enterprise 、Cloud三大 Agent 類型,針對(duì)企業(yè)內(nèi)外應(yīng)用 ( 包括 SaaS 服務(wù) ) 的多運(yùn)營(yíng)商全旅程,提供精細(xì)可視化健康監(jiān)控。
除了 ThousandsEyes 之外,思科圍繞 Application-First (關(guān)注應(yīng)用為先)正在不斷推出適合多云環(huán)境的 AIOps 平臺(tái),包括網(wǎng)絡(luò)、服務(wù)器、容器和應(yīng)用;比如 ACI/NAE 針對(duì)多云網(wǎng)絡(luò)環(huán)境,比如 AppDynamics 針對(duì)多云應(yīng)用自身,從應(yīng)用支撐的產(chǎn)品交易運(yùn)營(yíng)到應(yīng)用的代碼級(jí)排錯(cuò),還與思科多云網(wǎng)絡(luò)集成;再比如 Tetration 針對(duì)多云應(yīng)用安全,顆粒度精細(xì)到每一個(gè)操作系統(tǒng)包括容器,提供給企業(yè)零信任安全架構(gòu)。
通過全棧式 ( Fullstack ) 視角和架構(gòu)產(chǎn)品,思科正在幫助企業(yè)不斷提升 AIOps 水平,形成真正的基于數(shù)據(jù)驅(qū)動(dòng)的BizDevOps ( 業(yè)務(wù)/開發(fā)/運(yùn)營(yíng) ) 閉環(huán)運(yùn)營(yíng)能力,努力幫助企業(yè)擁抱云計(jì)算時(shí)代,推進(jìn)數(shù)字化轉(zhuǎn)型進(jìn)程。