提高電信級(jí)呼叫中心可靠性的策略
2006/05/10
呼叫中心是一個(gè)高度集成的復(fù)雜系統(tǒng),集成了眾多第三方的硬件、系統(tǒng)軟件和應(yīng)用軟件,先進(jìn)軟硬件設(shè)備和技術(shù)的引入,大大提高了系統(tǒng)平臺(tái)的處理能力和效率,提升了系統(tǒng)平臺(tái)對(duì)服務(wù)的支撐能力,但同時(shí)也增加了系統(tǒng)出現(xiàn)故障的概率,任何關(guān)鍵軟硬件設(shè)備的失效都將導(dǎo)致災(zāi)難性的后果。
電信級(jí)呼叫中心要求系統(tǒng)具有提供7×24小時(shí)不間斷服務(wù)的能力,因此對(duì)系統(tǒng)的可靠性要求非常高。電信級(jí)呼叫中心可靠性的提高,不但需要系統(tǒng)集成商具有堅(jiān)實(shí)的技術(shù)實(shí)力、大型電信級(jí)呼叫中心的成功實(shí)施經(jīng)驗(yàn)、嚴(yán)格規(guī)范的項(xiàng)目管理體系,而且需要有嚴(yán)格的系統(tǒng)可靠性分析和保障能力。
一、呼叫中心可靠性分析的目標(biāo)
呼叫中心可靠性分析的目標(biāo)是:網(wǎng)絡(luò)關(guān)鍵設(shè)備和呼叫路徑不存在單點(diǎn)故障;預(yù)防為主,通過(guò)有效的監(jiān)控、維護(hù)最大限度降低故障風(fēng)險(xiǎn);建立故障處理的應(yīng)急預(yù)案,保證有效收集數(shù)據(jù)并減少故障處理時(shí)間。因此,呼叫中心可靠性分析將首先考慮設(shè)計(jì)上的可靠性(包括設(shè)備/鏈路冗余備份),從系統(tǒng)設(shè)計(jì)上保證關(guān)鍵路徑不存在單點(diǎn)故障,并能在關(guān)鍵設(shè)備失效時(shí),提供保證人工呼叫接續(xù)的能力。
關(guān)鍵設(shè)備可靠性不可能達(dá)到100%,因此為了避免設(shè)備失效情況的發(fā)生,設(shè)備的監(jiān)控和預(yù)防是首要的工作,通過(guò)有效的系統(tǒng)監(jiān)控和日常維護(hù),80%的故障隱患是可以預(yù)先發(fā)現(xiàn)并消除的。
在系統(tǒng)的監(jiān)控、維護(hù)以及可靠性措施均得到有效執(zhí)行時(shí),設(shè)備失效的概率大大降低了,但設(shè)備失效的可能性仍然存在,在設(shè)備失效時(shí)如何采取快速有效的措施,收集足夠的分析數(shù)據(jù),減少故障歷時(shí),快速恢復(fù)系統(tǒng),使故障造成的損失降到最低,將變得尤為重要。
呼叫中心系統(tǒng)本身的高集成度決定了每個(gè)設(shè)備都與其它設(shè)備有著緊密的聯(lián)系,因此某個(gè)節(jié)點(diǎn)設(shè)備的失效,可能影響到其它關(guān)聯(lián)的設(shè)備,從而使故障恢復(fù)要涉及到除故障點(diǎn)外的其它設(shè)備。
二、呼叫中心的可靠性模型
呼叫中心可靠性分析對(duì)于提升呼叫中心系統(tǒng)的穩(wěn)定性,建立系統(tǒng)故障的主動(dòng)預(yù)警監(jiān)控體系,保證在故障發(fā)生時(shí)呼叫的正常接續(xù),縮短故障處理時(shí)長(zhǎng),收集故障數(shù)據(jù),從而持續(xù)改進(jìn)呼叫中心的可靠性具有非常重要的意義。
呼叫中心系統(tǒng)的高集成性和復(fù)雜性,對(duì)呼叫中心進(jìn)行系統(tǒng)的可靠性分析,帶來(lái)了很大的挑戰(zhàn),F(xiàn)有呼叫中心系統(tǒng)的可靠性多建立在解決方案提供商實(shí)踐經(jīng)驗(yàn)的基礎(chǔ)上,目前仍缺乏相關(guān)的系統(tǒng)理論模型來(lái)確保高可靠性目標(biāo)的實(shí)現(xiàn)。
根據(jù)多年的實(shí)踐經(jīng)驗(yàn),對(duì)電信級(jí)呼叫中心提出如下高可靠性分析模型,如圖1所示。該模型將電信級(jí)呼叫中心可靠性分析分為四個(gè)維度:網(wǎng)絡(luò)可靠性、呼叫路徑可靠性、邊界可靠性、非呼叫路徑可靠性。
1.網(wǎng)絡(luò)可靠性
呼叫中心集成了大量的軟硬件設(shè)備,不同的軟硬件設(shè)備通過(guò)網(wǎng)絡(luò)進(jìn)行信息的交互,協(xié)同完成呼叫的接續(xù)和處理。網(wǎng)絡(luò)系統(tǒng)作為呼叫中心信息處理的載體,其穩(wěn)定性和可靠性是整體系統(tǒng)穩(wěn)定的基礎(chǔ)。網(wǎng)絡(luò)可靠性包括:網(wǎng)絡(luò)設(shè)備的可靠性、網(wǎng)絡(luò)傳輸鏈路的可靠性、防御網(wǎng)絡(luò)外部攻擊的可靠性。
2.呼叫路徑可靠性
呼叫中心的基本功能是實(shí)現(xiàn)呼叫的接續(xù)和處理,一個(gè)呼叫的接續(xù)過(guò)程涉及到不同設(shè)備的協(xié)同處理,呼叫信息的接續(xù)過(guò)程定義為呼叫路徑,呼叫路徑的任何節(jié)點(diǎn)/鏈接失效,都將導(dǎo)致呼叫接續(xù)的中斷。因此,呼叫路徑可靠性對(duì)整個(gè)系統(tǒng)的可靠性具有舉足輕重的意義。
3.邊界可靠性
呼叫中心需要與其它外部系統(tǒng)進(jìn)行信息的交互,要保證呼叫中心的可靠性,同樣要考慮與呼叫中心交互的外部系統(tǒng)對(duì)呼叫中心的影響,包括網(wǎng)絡(luò)的隔離、信息有效性的驗(yàn)證、外部系統(tǒng)故障的影響、呼叫量的雪崩效應(yīng),以提高呼叫中心系統(tǒng)自身的免疫力和抗干擾能力。
4.非呼叫路徑可靠性
呼叫中心系統(tǒng)集成的軟硬件產(chǎn)品,除呼叫路徑上的關(guān)鍵節(jié)點(diǎn)設(shè)備外,還包括了實(shí)現(xiàn)輔助支撐功能的設(shè)備,這些設(shè)備的失效不會(huì)對(duì)正常的呼叫接續(xù)和處理造成影響,但會(huì)影響呼叫中心輔助功能的實(shí)現(xiàn),在此將這些設(shè)備定義為非呼叫路徑設(shè)備。非呼叫路徑設(shè)備包括:消息服務(wù)器、監(jiān)控服務(wù)器、接口服務(wù)器、接口鏈路。從呼叫中心的投入和產(chǎn)出角度考慮,非呼叫路徑設(shè)備一般不提供備份功能。
三、呼叫中心的可靠性分析方法
呼叫中心可靠性模型的每個(gè)維度都有一些設(shè)備/軟件節(jié)點(diǎn)組成,每個(gè)維度的可靠性需要通過(guò)組成節(jié)點(diǎn)以及節(jié)點(diǎn)之間鏈路的可靠性來(lái)實(shí)現(xiàn),節(jié)點(diǎn)可靠性的實(shí)現(xiàn)可以抽象為3個(gè)層次:設(shè)計(jì)可靠性、主動(dòng)預(yù)警能力和應(yīng)急預(yù)案。通過(guò)對(duì)所有節(jié)點(diǎn)3個(gè)層次的可靠性分析,可以實(shí)現(xiàn)可靠性模型每個(gè)維度的可靠性,從而實(shí)現(xiàn)系統(tǒng)可靠性。根據(jù)圖2的可靠性分析矩陣,可以建立呼叫中心可靠性分析方法。
對(duì)于呼叫中心而言,客戶(hù)從發(fā)起呼叫到呼叫中心服務(wù)人員接聽(tīng)呼叫的路徑,是呼叫中心提供服務(wù)能力的關(guān)鍵路徑,因此呼叫中心可靠性分析的核心即是如何保證呼叫路徑的可靠性。網(wǎng)絡(luò)作為呼叫中心系統(tǒng)賴(lài)以運(yùn)行的基礎(chǔ),其可靠性不言而喻,鑒于網(wǎng)絡(luò)可靠性方面已經(jīng)具有大量的理論和實(shí)踐指導(dǎo),因此本文不做詳細(xì)分析。對(duì)于呼叫中心可靠性模型的非呼叫路徑可靠性和邊界可靠性,限于篇幅原因,本文也不做詳細(xì)介紹。
在客戶(hù)向呼叫中心發(fā)起人工服務(wù)的呼叫請(qǐng)求時(shí),電信網(wǎng)的信令數(shù)據(jù)、客戶(hù)的按鍵選擇數(shù)據(jù)、呼叫的路由選擇數(shù)據(jù)以及客戶(hù)信息數(shù)據(jù)等,在多個(gè)設(shè)備節(jié)點(diǎn)之間進(jìn)行交換,從而協(xié)同實(shí)現(xiàn)呼叫的接續(xù)過(guò)程,構(gòu)成了呼叫中心的呼叫路徑。
呼叫路徑上的每一個(gè)節(jié)點(diǎn)(設(shè)備或軟件系統(tǒng))都是呼叫路徑的關(guān)鍵節(jié)點(diǎn),任何節(jié)點(diǎn)的失效,都將直接中斷或影響正常的呼叫接續(xù)。因此,企業(yè)必須對(duì)呼叫路徑上的每個(gè)節(jié)點(diǎn)進(jìn)行全面系統(tǒng)的可靠性分析,以確保呼叫路徑的高可靠性和高可用性。
呼叫路徑的節(jié)點(diǎn)可靠性分析包括以下3個(gè)層次,即節(jié)點(diǎn)的設(shè)計(jì)可靠性、節(jié)點(diǎn)主動(dòng)預(yù)警能力、節(jié)點(diǎn)的故障應(yīng)急預(yù)案。
1.設(shè)計(jì)可靠性
節(jié)點(diǎn)需要支持雙機(jī)熱備,保證不存在單點(diǎn)故障,同時(shí)必要時(shí)還可以設(shè)置一臺(tái)獨(dú)立的冷備份系統(tǒng),以應(yīng)對(duì)雙熱備系統(tǒng)同時(shí)失效的小概率故障事件。
2.主動(dòng)預(yù)警
節(jié)點(diǎn)應(yīng)具備主動(dòng)預(yù)警監(jiān)控模塊,從而改變傳統(tǒng)的由維護(hù)人員被動(dòng)響應(yīng)故障的局面,實(shí)時(shí)對(duì)系統(tǒng)的運(yùn)行數(shù)據(jù)進(jìn)行監(jiān)測(cè)(如CPU、內(nèi)存、硬盤(pán)容量、網(wǎng)絡(luò)通信、節(jié)點(diǎn)負(fù)載等),對(duì)超過(guò)預(yù)警閥值的參數(shù)進(jìn)行主動(dòng)預(yù)警,通過(guò)短信、呼叫等手段主動(dòng)通知維護(hù)人員,以利于維護(hù)人員提前發(fā)現(xiàn)故障的隱患,為故障隱患的排除爭(zhēng)取寶貴的時(shí)間。
3.故障應(yīng)急預(yù)案
即使在設(shè)計(jì)上已經(jīng)保證了系統(tǒng)的可靠性,并且設(shè)置了系統(tǒng)運(yùn)行主動(dòng)預(yù)警模塊,故障的出現(xiàn)還是不能100%避免的。根據(jù)故障處理的指導(dǎo)原則,以最短的時(shí)間完成故障的處理和系統(tǒng)的恢復(fù),最大限度地減少故障造成的運(yùn)營(yíng)損失,必須建立節(jié)點(diǎn)的故障應(yīng)急預(yù)案,包括故障點(diǎn)的快速確認(rèn)方法、故障數(shù)據(jù)收集、處理和恢復(fù)的詳細(xì)步驟,從而保證在故障處理時(shí)能夠游刃有余。
通信世界網(wǎng)(www.cww.net.cn)
相關(guān)鏈接: