隨著全球經(jīng)濟(jì)一體化的浪潮,中國正在成為世界制造業(yè)的中心,它為中國的企業(yè)提供了更多機會的同時,也帶來了更強勁的競爭。隨著全球化競爭的加劇,制造企業(yè)開始尋求新的戰(zhàn)略競爭點,整個產(chǎn)業(yè)也逐漸從產(chǎn)品和價格競爭轉(zhuǎn)向服務(wù)競爭。為了提高企業(yè)的競爭力,目前很多企業(yè)在信息化技術(shù)方面加大了投入。比如ERP、PDM和CRM等信息技術(shù)在企業(yè)的推廣應(yīng)用等。
ERP的意思是企業(yè)資源計劃,系統(tǒng)主要包括四大部分,即財務(wù)管理、生產(chǎn)制造管理、分銷與后勤管理及其他管理模塊。它的重點是在企業(yè)的內(nèi)部生產(chǎn)領(lǐng)域。它強調(diào)的是以產(chǎn)品為中心,以企業(yè)內(nèi)部生產(chǎn)領(lǐng)域為重點。
PDM側(cè)重于對產(chǎn)品開發(fā)階段數(shù)據(jù)和企業(yè)內(nèi)部產(chǎn)品數(shù)據(jù)的管理,它的體系結(jié)構(gòu)是強調(diào)以文檔為中心的研發(fā)流程管理,重點在于建立文檔之間的聯(lián)接。
CRM (Custom Relationship Management)的意思是客戶關(guān)系管理,它強調(diào)把客戶放在核心位置,其理念要求企業(yè)完整地認(rèn)識整個客戶生命周期,圍繞“客戶接觸點”,提供與客戶溝通的統(tǒng)一、集成的平臺和工具,涉及企業(yè)一切與客戶有關(guān)的信息交互進(jìn)行處理,提高員工、客戶接觸的效率和客戶反饋率,為客戶提供整體的服務(wù)!同時采用數(shù)據(jù)挖掘技術(shù)對有關(guān)信息進(jìn)行分析,得到有價值的信息和知識。
如果說現(xiàn)在企業(yè)的競爭是產(chǎn)品的競爭、企業(yè)資源的競爭,那么,不久的將來它將轉(zhuǎn)向以客戶為中心的服務(wù)上。CRM系統(tǒng)正是為滿足上述需求應(yīng)運而生。目前,在發(fā)達(dá)國家,制造業(yè)的服務(wù)創(chuàng)新已成為企業(yè)利潤的增長點。
本文針對CRM客戶關(guān)系管理中的客戶流失問題,結(jié)合制造業(yè)的特點,從數(shù)據(jù)挖掘技術(shù)層面進(jìn)行思路探討。試圖得到企業(yè)管理層面和信息技術(shù)層面對CRM客戶關(guān)系管理中的客戶流失問題予以關(guān)注,為企業(yè)未來贏得新的利潤增長點。
1.問題由來
CRM對制造商的作用在于了解客戶所有的行為活動并確保與客戶的關(guān)系。它能把前端辦公和后臺生產(chǎn)聯(lián)系起來,是企業(yè)和客戶的交叉點,能幫助制造商制造出定制化的產(chǎn)品,增加銷售并降低營銷開支,且使客戶的購買變得更加方便。制造業(yè)CRM系統(tǒng)主要包括營銷管理、銷售管理、服務(wù)管理、呼叫中心、客戶信息管理、決策支持等多個模塊。它的關(guān)鍵技術(shù)之一在于能否提供基于聯(lián)機分析處理的數(shù)據(jù)倉庫技術(shù),從而具備動態(tài)、整合的客戶數(shù)據(jù)管理和查詢功能,對客戶購買行為具有參考功能;對客戶流失具有警告功能。此外,CRM的客戶分類技術(shù),讓企業(yè)建立起一對一的客戶服務(wù)體系,實行差異化客戶管理(如根據(jù)客戶特點,可將其分為① 內(nèi)在價值型客戶。② 外在價值型客戶。③ 戰(zhàn)略型價值客戶), 為客戶創(chuàng)造非同一般的價值,也是企業(yè)從中獲得長久利潤、需要引起關(guān)注的關(guān)鍵技術(shù)之一。
工程機械尤其是混凝土機械近年來獲得了迅猛發(fā)展,與此同時,混凝土機械產(chǎn)品市場又有兩大特點:一是市場需求發(fā)展大,產(chǎn)品使用周期短,兩三年后的回頭客相當(dāng)多;二是隨著社會改革的推進(jìn)和國家投資方向的轉(zhuǎn)移,客戶群體會有較大方面的變動。如國有企業(yè)占主體時,以國企為主要購買力;而隨著商品租賃業(yè)發(fā)展,個體購買又成為了主力;而大型建設(shè)施工購買又回到了建設(shè)施工單位。由于市場的競爭,相同產(chǎn)品的制造廠家對客戶的爭奪往往相當(dāng)激烈,有時甚至到了白熱化的地步。
顯然,我們既要大力發(fā)展新客戶,又要努力保留舊客戶。保留一個舊客戶要比爭取一個新客戶便宜的多。為改進(jìn)保留客戶的一種途徑就是客戶真正流失之前準(zhǔn)確預(yù)測并采取行動挽留客戶,而基于客戶關(guān)系管理的數(shù)據(jù)挖掘技術(shù)和方法是解決該問題的途徑。一般說來,針對CRM中客戶獲得、客戶保留、客戶忠誠和客戶贏利分析各個方面,客戶特性及客戶行為信息的分類具有相當(dāng)重要的意義。最大程度的預(yù)測潛在的客戶流失是我們需要密切關(guān)注的。采用數(shù)據(jù)挖掘的分類思路可以在制造業(yè)客戶關(guān)系管理中起到相當(dāng)重要的作用。
2.CRM軟件中常用數(shù)據(jù)挖掘方法
利用數(shù)據(jù)挖掘的分類算法構(gòu)造CRM的分類器,是數(shù)據(jù)挖掘技術(shù)在商業(yè)領(lǐng)域中的重要應(yīng)用之一。數(shù)據(jù)挖掘的中的聚類方法和決策樹分類算法是常見的,也是一種相對準(zhǔn)確、有效的分類方法。
CRM相關(guān)技術(shù)的發(fā)展日新月異,它包括運營型(前臺),分析型(后臺),協(xié)作型(渠道)。這里尤其是分析型CRM的技術(shù)發(fā)展得最快,這也是很多CRM理想中的功能實現(xiàn)成為可能的關(guān)鍵。數(shù)據(jù)倉庫,數(shù)據(jù)挖掘和呼叫中心是三個其主要的技術(shù)組成。本文主要分析數(shù)據(jù)挖掘部分。
所謂數(shù)據(jù)挖掘是從大型的數(shù)據(jù)庫中提取隱藏的、有預(yù)測性的信息,它是能幫助企業(yè)從已有數(shù)據(jù)中提取到最先進(jìn)和流行的趨勢并為其提供效益。簡言之,數(shù)據(jù)挖掘是應(yīng)用數(shù)據(jù)分析和運算法則來探索數(shù)據(jù)模式并進(jìn)行科學(xué)地描述和預(yù)測。
常用的數(shù)據(jù)挖掘方法有如下幾種:
2.1 回歸預(yù)測
回歸預(yù)測是比較傳統(tǒng)的預(yù)測方法,它是根據(jù)歷史記錄分析得出總體趨勢,并將這種趨勢用某種數(shù)學(xué)方程式來表示。利用這個方程式,就可以輸人未來的一個或多個變量計算出預(yù)測結(jié)果。如果方程式的變量是一次方的,那么就成為直線性回歸,如果是多次訪問的,就成為區(qū)線性回歸。典型的客戶流失預(yù)測都可以采取回歸分析的方法。
2.2 決策樹
決策樹是一種類似于枝丫形狀的二分制。數(shù)據(jù)分析和預(yù)測方法,主要適用于對數(shù)據(jù)進(jìn)行歸類分割和預(yù)測。根據(jù)客戶特征,對客戶大市場進(jìn)行分割,從而得到相對較小的客戶群體。
2.3 聚類和鄰點預(yù)測
聚類和鄰點預(yù)測對于客戶關(guān)系管理來說是有類似的分析目的的。聚類是指如何將一批數(shù)據(jù)按照相似特性歸類,使我們能對他們有一個形象的概括性理解;鄰點預(yù)測是在歸類的基礎(chǔ)上對未來數(shù)據(jù)進(jìn)行預(yù)測。
2.4 規(guī)則導(dǎo)引
規(guī)則導(dǎo)引是從一個樣本數(shù)據(jù)庫中發(fā)現(xiàn)并歸納出數(shù)據(jù)行為模式,即用“如果A,那么B,否則就是C”,這樣的判斷語句來描述這種隱藏在數(shù)據(jù)倉庫中的規(guī)律。數(shù)據(jù)挖掘技術(shù)中的規(guī)則導(dǎo)引就是要從大量的客戶數(shù)據(jù)中發(fā)掘出這些規(guī)則。
3.制造企業(yè)CRM數(shù)據(jù)挖掘綜述
在CRM系統(tǒng)中,最重要最有挑戰(zhàn)性的則是對流失客戶的預(yù)測。制造企業(yè)營銷和市場部門,根據(jù)購買產(chǎn)品的客戶信息資料,通過數(shù)據(jù)挖掘方法,往往可以預(yù)測潛在的流失客戶。
客戶流失分析就是應(yīng)用數(shù)據(jù)挖掘技術(shù),預(yù)測哪些是潛在流失客戶,同時評估出最有效的客戶保持方法。本文提出一套基于制造業(yè)CRM系統(tǒng)中預(yù)測客戶流失的方法的基本思路。
該方法一般分為三個步驟:第一,應(yīng)用軟件對數(shù)據(jù)進(jìn)行挖掘測試,其中包括統(tǒng)一的客戶資料,客戶屬性,購買信息,模型參數(shù),模型等等。第二,應(yīng)用數(shù)據(jù)分析方法和所討論的數(shù)據(jù)挖掘技術(shù)對客戶流失前的行為分析進(jìn)行簡化的知識發(fā)現(xiàn)。第三,應(yīng)用系統(tǒng)聚類和決策樹ID3的方法對模型應(yīng)用的實驗結(jié)果進(jìn)行過程分析。
常見的數(shù)據(jù)挖掘主要分為兩種:即探索性的數(shù)據(jù)挖掘和驗證性的數(shù)據(jù)挖掘。其中探索性的數(shù)據(jù)挖掘中最常使用的就是聚類,而驗證性數(shù)據(jù)挖掘的代表就是分類。聚類分析法是一種無監(jiān)督的自下而上的學(xué)習(xí)過程,主要目的是把沒有“標(biāo)記”的數(shù)據(jù)分為有意義的“組”(或者就叫聚類);而分類是給定已知“標(biāo)記”的訓(xùn)練數(shù)據(jù),然后通過學(xué)習(xí)得到描述模式,然后運用該模式對未來的數(shù)據(jù)進(jìn)行分類,是一種帶監(jiān)督的自上而下的學(xué)習(xí),如決策樹ID3法。由于這兩種類別具有一定的典型性,都可以用于數(shù)據(jù)挖掘的客戶流失分析。
3.1數(shù)據(jù)源介紹
進(jìn)行數(shù)據(jù)分析首先必須從客戶的數(shù)據(jù)庫中間找到最能夠代表和刻畫客戶行為的屬性。針對2005一2006兩年中,某企業(yè)800個購買某工程機械產(chǎn)品的客戶信息,從中了解到導(dǎo)致客戶流失的因素較多,但有共性的部分也有很多。因此,我們把客戶與本公司交易次數(shù)、公司屬性、公司資產(chǎn)規(guī)模、付款方式、公司所在地、產(chǎn)品用途作為統(tǒng)計信息中的主要屬性。
我們將所擁有的所有可能的客戶信息屬性變量轉(zhuǎn)換成0,1,2等屬性,其他數(shù)字變量不變,應(yīng)用2一檢驗,選除了某特定制造企業(yè)客戶流失的一般統(tǒng)計屬性。
3.2 系統(tǒng)聚類實驗分析
系統(tǒng)聚類法實驗的基本思想是:設(shè)有n個樣品,每個樣品測得m項指標(biāo)。然后用不同的數(shù)據(jù)表示客觀數(shù)據(jù)的定量屬性和定性屬性。當(dāng)定義或計算樣品間的距離(或相似系數(shù))和類與類之間的距離之后?梢詫個樣品各自自成一類,這時類間的距離與樣品間的距離是等價的;然后將距離最近的兩類合并,并計算新類與其他的類間距離,再按最小距離準(zhǔn)則并類。這樣每次縮小一類,直到所有的樣品都并成一類為止。這個過程再可以用譜系聚類圖形象表達(dá)出來。
3.3 實驗聚類
根據(jù)特定產(chǎn)品、眾多客戶的統(tǒng)計信息中的主要屬性,按照上述系統(tǒng)聚類實驗,得到我們所需要的信息。
基于上述個體行為數(shù)據(jù)進(jìn)行聚類操作,在對未來行為的預(yù)測能力上,往往比其他類型的數(shù)據(jù)效果更好、更精準(zhǔn)。
3.4 決策樹ID3法實驗及分析
決策樹技術(shù)是用于分類和預(yù)測的主要技術(shù),決策樹學(xué)習(xí)是以實例為基礎(chǔ)的歸納學(xué)習(xí)算法。著眼于從一組無次序、無規(guī)則的事例中推理出決策樹表示形式的分類規(guī)則。它采用自頂向下的遞歸方式,在決策樹的內(nèi)部節(jié)點進(jìn)行屬性的比較,并根據(jù)不同屬性判斷從該節(jié)點向下的分支,在決策樹的葉節(jié)點得到結(jié)論。所以從根到葉節(jié)點就對應(yīng)著一條合取規(guī)則,整棵樹就對應(yīng)著一組析取表達(dá)式規(guī)則。
考慮一個任意的變量,它有兩個不同的值A(chǔ)和B。假設(shè)已知這個變量不同值的概率分配,將估測該概率分配的不純度。
情況1.如果P(A)=1和P(B)=0,那么知道這個變量的值一定為A,不存在不純度,因此已知變量結(jié)果值不會帶來任何的信息。
情況2.如果P(A)=P(B)=0.5,那么它的不純度明顯地高于P(A)=0.1和P(B)二0.9的情況。在這種情況下,已知變量的結(jié)果值就會攜帶信息。
不純度的最佳評估方法是平均信息量,也就是信息熵。定義如下:設(shè)S是s個樣本數(shù)據(jù)集合。假定類標(biāo)號屬性具有m個不同值,定義m個不同類C;(i=l,2,…,m)。設(shè)s:,是類C中的樣本數(shù),對一個給定的樣本分類所需的期望信息或者信息墑為:
其中P為任意樣本屬于Ci的概率,并用Si/S估計。信息增益:信息增益是指期望信息或者信息嫡的有效減少量(通常用“字節(jié)”衡量),根據(jù)它能夠確定在什么樣的層次上選擇什么樣的變量來分類。假設(shè)存在兩個類P和N,并且記錄集5中包括x個屬于類P的記錄和y個屬于類N的記錄。那么,用于確定記錄集5中某個記錄屬于哪個類的所有信息量為:
信息增益可通過下式計算:
信息量:
信息增益:Gain(A)=Info(p,n)-E(A)
重復(fù)上述步驟,分別得到各個根節(jié)點,同時計算相應(yīng)屬性的信息增益值。最后,根據(jù)公式計算結(jié)果得到制造企業(yè)是否需要對該潛在的流失客戶實施新的服務(wù)的決策樹,如圖1所示。
3.5 實驗規(guī)則引導(dǎo)結(jié)果及實驗方法分析及評價
遍歷決策樹,輸出葉結(jié)點類屬性值,ID3通過不斷的循環(huán)處理,逐步求精決策樹,直至找到一個完全正確的決策樹。用ID3算法構(gòu)造的決策樹是從頂向下歸納,最后形成了一組類似IF……THEN的規(guī)則。其最原始的程序只是用來區(qū)分象棋中的走步,所以區(qū)分的類別只有兩種,即真或假,其屬性值也是一些離散有限的值。現(xiàn)在ID3算法己發(fā)展到允許多于兩個類別,而其屬性值可以是整數(shù)或?qū)崝?shù),這里僅僅采用了它最原始的原則,提供一條基本分析思路。這種算法利用了互信息(信息增益)的概念,算法的基礎(chǔ)理論清晰,使得算法較簡單。該算法的計算時間是例子個數(shù)、特征個數(shù)、結(jié)點個數(shù)之積的線性函數(shù)。而且搜索空間是完全的假設(shè)空間,目標(biāo)函數(shù)必在搜索空間中,不存在無解的危險。可以利用全部訓(xùn)練例的統(tǒng)計性質(zhì)進(jìn)行決策,從而抵抗噪音。
但用信息增益作為特征選擇量存在一個假設(shè),即訓(xùn)練例子集中的正、反例的比例應(yīng)與實際問題領(lǐng)域里正反例比例相同。但一般實際情況并不能保證相同,因而計算訓(xùn)練集的信息增益就有偏差。ID3在建樹時,每個節(jié)點僅含有一個特征,是一種單變元的算法,特征間的相關(guān)性強調(diào)不夠。雖然將多個特征用一棵樹連在一起,但聯(lián)系還是松散的。
正因為如此,我們在具體的客戶關(guān)系數(shù)據(jù)處理中,目前仍處于一種摸索的階段。但上述方法的探討,仍值得借鑒或進(jìn)一步深人研究。
4 結(jié)語
本文試圖將數(shù)據(jù)挖掘技術(shù)中有最代表性的系統(tǒng)聚類分析法和決策樹ID3算法思路應(yīng)用于制造企業(yè)的客戶流失分析,為基于制造行業(yè)的CRM的客戶流失分析做一初步的探討。對于數(shù)據(jù)挖掘遇到的個體行為數(shù)據(jù),分別運用兩種較有代表性的數(shù)據(jù)挖掘方法進(jìn)行具體實驗和理論方法分析比較。嘗試應(yīng)用聚類分析和決策樹這兩種有代表的數(shù)據(jù)挖掘方法融入到制造業(yè)客戶流失管理的信息處理中,為制造企業(yè)針對不同客戶群體提供個性化服務(wù)提供一個分析思路,為未來企業(yè)信息化競爭創(chuàng)建一個良好的平臺。
CIO時代