隨著數(shù)據(jù)庫技術(shù)、網(wǎng)絡技術(shù)的不斷發(fā)展及數(shù)據(jù)庫管理系統(tǒng)的廣泛應用,數(shù)據(jù)庫中存儲的數(shù)據(jù)量急劇增大。然而,如何有效地使用這些數(shù)據(jù)卻成為一個問題,因為往往是數(shù)據(jù)豐富而知識缺乏,人們目前所使用的數(shù)據(jù)庫技術(shù)無法將隱藏在數(shù)據(jù)背后的重要信息挖掘出來利用,所以如何迅速、準確、有效且適量地提供用戶所需的信息,發(fā)現(xiàn)信息之間潛在的聯(lián)系,支持管理決策就是數(shù)據(jù)挖掘和數(shù)據(jù)倉庫要解決的課題,同時也是客戶關(guān)系管理系統(tǒng)產(chǎn)生的必要條件和最終目的。
一、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)分析
1.1 數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是一個在企業(yè)管理和決策中面向主題的(Subject-Oriented)、集成的(Integrated)、反映歷史變化的(TimeVariant)、相對穩(wěn)定(Non-Volatile)的數(shù)據(jù)集合。我們可以從兩個層次加以理解:首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對多個異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。數(shù)據(jù)倉庫不是靜態(tài)的概念,只有把信息及時交給需要這些信息的使用者,供他們做出改善其業(yè)務經(jīng)營的決策,信息才能發(fā)揮作用,信息才有意義。而把信息加以整理歸納和重組,并及時提供給相應的管理決策人員,是數(shù)據(jù)倉庫的根本任務。因此,從產(chǎn)業(yè)界的角度看,數(shù)據(jù)倉庫建設(shè)是一個工程,是一個過程。
整個數(shù)據(jù)倉庫系統(tǒng)是一個包含源個層次的體系結(jié)構(gòu),具體如下:
1、數(shù)據(jù)源:是數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),是整個系統(tǒng)的數(shù)據(jù)源泉。通常包括企業(yè)內(nèi)部信息和外部信息。內(nèi)部信息包括存放于RDBMS中的各種業(yè)務處理數(shù)據(jù)和各類文檔數(shù)據(jù)。外部信息包括各類法律法規(guī)、市場信息和競爭對手的信息等。
2、數(shù)據(jù)的存儲與管理:是整個數(shù)據(jù)倉庫系統(tǒng)的核心,數(shù)據(jù)倉庫的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫,同時也決定了其對外部數(shù)據(jù)的表現(xiàn)形式。要決定采用什么產(chǎn)品和技術(shù)來建立數(shù)據(jù)倉庫的核心,則需要從數(shù)據(jù)倉庫的技術(shù)特點著手分析,針對現(xiàn)有各業(yè)務系統(tǒng)的數(shù)據(jù),進行抽取、清理,并有效集成,按照主題進行組織。
3、OLAP服務器:對分析需要的數(shù)據(jù)進行有效集成,按多維模型予以組織,以便進行多角度、多層次的分析,并發(fā)現(xiàn)趨勢。其具體實現(xiàn)可以分為:ROLAP、MOLAP和HOLAP。ROLAP 基本數(shù)據(jù)和聚合數(shù)據(jù)均存放在RDBMS 之中曰MOLAP 基本數(shù)據(jù)和聚合數(shù)據(jù)均存放于多維數(shù)據(jù)庫中曰HOLAP 基本數(shù)據(jù)存放于RDBMS 之中,聚合數(shù)據(jù)存放于多維數(shù)據(jù)庫中。
4、前端工具:主要包括各種報表工具、查詢工具、數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市的應用開發(fā)工具。其中數(shù)據(jù)分析工具主要針對OLAP服務器,報表工具、數(shù)據(jù)挖掘工具主要針對數(shù)據(jù)倉庫。
數(shù)據(jù)倉庫要求數(shù)據(jù)量大,數(shù)據(jù)正確全面,所以數(shù)據(jù)在進入數(shù)據(jù)倉庫前必須經(jīng)過提取、轉(zhuǎn)換與集成,把數(shù)據(jù)按主題分類,形成多維數(shù)據(jù)模型。它以多維數(shù)據(jù)模型為基礎(chǔ),實現(xiàn)數(shù)據(jù)的分析處理,主要用于支持管理決策。數(shù)據(jù)進入數(shù)據(jù)倉庫后,一般會被長期保存,基本不會進行修改和刪除操作,主要實現(xiàn)數(shù)據(jù)的查詢。
數(shù)據(jù)倉庫與傳統(tǒng)關(guān)系型數(shù)據(jù)庫不同,主要區(qū)別在于數(shù)據(jù)倉庫打破了關(guān)系數(shù)據(jù)庫中數(shù)據(jù)的規(guī)范性,實現(xiàn)了數(shù)據(jù)的重組,增加了數(shù)據(jù)冗余度;其次傳統(tǒng)關(guān)系型數(shù)據(jù)庫為了實現(xiàn)數(shù)據(jù)處理的及時性,要求數(shù)據(jù)盡量少,而數(shù)據(jù)倉庫為了更有效的實現(xiàn)數(shù)據(jù)查詢,要求存儲的數(shù)據(jù)盡量多,實現(xiàn)海量存儲。
1.2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù),是近幾年國內(nèi)外迅速發(fā)展起來的一門交叉學科,涉及到數(shù)據(jù)庫、統(tǒng)計學、人工智能與機器學習等多個領(lǐng)域,并在金融、商業(yè)零售、電信以及生物醫(yī)學和基因分析等領(lǐng)域得到廣泛應用。
1.2.1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘(Data Ming),是指從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程,提取的知識一般可表示為概念(ConcePts)、規(guī)則(Rules)、規(guī)律(Regularities)、模式(Patterns)等形式。
數(shù)據(jù)挖掘是知識發(fā)現(xiàn)的過程,是將未加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的整個過程。該過程包含一系列的步驟:確定業(yè)務對象、數(shù)據(jù)準備、數(shù)據(jù)挖掘、模式評估和知識表示。
1.2.2 數(shù)據(jù)挖掘的技術(shù)與方法
數(shù)據(jù)挖掘方法是以數(shù)據(jù)庫為對象,基于機器學習、科學計算、統(tǒng)計分析等技術(shù),形成了數(shù)據(jù)挖掘方法和技術(shù)。一般,數(shù)據(jù)挖掘常用的技術(shù)與方法可以分為以下幾個方面:
1)決策樹方法
決策樹方法是利用信息論的原理建立決策樹,主要用于分類和預測。決策樹是一種簡單的知識表示方法,它將事例逐步分類成代表不同的類別。由于分類規(guī)則比較直觀,易于理解,實用效果好,影響較大,因而得到廣泛應用。決策樹最早的算法是Quinlan 提出的ID3 算法,最流行的是其改進版的C4.5 算法。
2)聚類方法
聚類分析是直接分析樣本,按照各樣本數(shù)據(jù)間的距離遠近將樣本數(shù)據(jù)分成若干個不同的類。一般,同一類中的對象相似度很高,不同類中的對象相似度很差。聚類分析屬于無監(jiān)督的分類方法。
3)統(tǒng)計分析方法
統(tǒng)計分析方法是通過統(tǒng)計學中的技術(shù)方法實現(xiàn)數(shù)據(jù)庫的數(shù)據(jù)分析,發(fā)現(xiàn)數(shù)據(jù)間的關(guān)系和規(guī)律。常用的方法有:回歸分析、相關(guān)分析、主成分分析等。
4)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則通過對給定數(shù)據(jù)集中的數(shù)據(jù)進行關(guān)聯(lián)分析,描述一個事物中某些屬性頻繁同時出現(xiàn)的條件,發(fā)現(xiàn)隱藏在其中的有趣的聯(lián)系或規(guī)律。一旦建立起數(shù)據(jù)項間的關(guān)聯(lián)規(guī)則,則其中某一項的屬性值就可以依據(jù)其他屬性值進行預測。
5)可視化技術(shù)
可視化數(shù)據(jù)分析技術(shù)在傳統(tǒng)圖表功能基礎(chǔ)上進行了拓展,為用戶提供交互式的數(shù)據(jù)瀏覽,幫助用戶更清楚地剖析數(shù)據(jù)。當所要識別的不規(guī)則事物是一系列圖形而不是數(shù)字表格時,人的識別速度是最快的。
二、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應用
2.1 客戶關(guān)系管理
客戶關(guān)系管理淵CRM冤關(guān)注的是企業(yè)與客戶之間實時、方便的信息交互,通過與客戶多渠道的接觸、交流和溝通,實現(xiàn)從野接觸管理冶到野客戶關(guān)懷冶的角色轉(zhuǎn)變,企業(yè)的經(jīng)營中心也從產(chǎn)品或市場轉(zhuǎn)變?yōu)榭蛻簟?蛻絷P(guān)系管理最核心的任務是對企業(yè)運營過程中所得到的各種數(shù)據(jù)進行分析,進而為企業(yè)經(jīng)營決策提供支持和依據(jù)。
從功能上來看,CRM系統(tǒng)可分為三種類型:
1)操作型CRM
操作型CRM 也稱為流程型CRM,主要用于客戶信息的自動集成過程,實現(xiàn)企業(yè)各部門對客戶信息的協(xié)同合作。
2)分析型CRM
分析型CRM 用于分析操作型CRM 中產(chǎn)生的各種數(shù)據(jù),使用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)產(chǎn)生商務智能,為企業(yè)決策提供支持。
3)合作型CRM
合作型CRM用于企業(yè)與客戶的合作服務系統(tǒng),包括電話、呼叫系統(tǒng)、電子郵件等,它能實現(xiàn)客戶信息的全面收集。
2.2 數(shù)據(jù)倉庫的形成
數(shù)據(jù)倉庫是CRM 的中央存儲系統(tǒng)。在這個信息爆炸的時代,各個企業(yè)經(jīng)過長期經(jīng)營,收集了大量的客戶數(shù)據(jù)。而這些海量、異構(gòu)的數(shù)據(jù)被分散在不同部門,沒有得到充分合理的利用。因此,首先要做的是對這些海量分散的數(shù)據(jù)進行清洗、集成和轉(zhuǎn)換,建立一個整合的、標準化、結(jié)構(gòu)化的數(shù)據(jù)模型,形成全面、一致和面向決策的數(shù)據(jù),即數(shù)據(jù)倉庫。對已形成的數(shù)據(jù)倉庫,按照不同的主題,產(chǎn)生多個對應的數(shù)據(jù)處理模塊,如普通客戶數(shù)據(jù)模塊,Vip 客戶數(shù)據(jù)模塊,團體客戶數(shù)據(jù)模塊等,這種多數(shù)據(jù)模塊的建設(shè)有利于分析不同客戶的行為特點。
2.3 數(shù)據(jù)挖掘技術(shù)的應用
使用數(shù)據(jù)挖掘技術(shù)對企業(yè)客戶信息進行分析,從而挖掘出對企業(yè)發(fā)展有價值的信息,如:新客戶開發(fā)、交叉銷售及預測、客戶信用分析、客戶細分、客戶類別分析等客戶關(guān)系管理功能,為企業(yè)決策者提供更有效的的決策支持,最大程度地發(fā)揮企業(yè)CRM 的作用。近年來,隨著市場競爭的加劇,企業(yè)要想獲得一個新客戶,所花費的開銷往往是爭取留住老客戶的幾倍。有統(tǒng)計數(shù)據(jù)表明:
1)公司一般每年平均流失10%的老客戶;
2)企業(yè)留住5%的老客戶,利潤提升100%;
3)開發(fā)新客戶的成本是留住老客戶成本的5-8 倍;
4)一個公司如果將其客戶流失率降低5%,其利潤就可能增加25-85%。
因此保持老客戶就顯得更有價值。那么,如何才能預防、減少客戶的流失呢?一個非常重要的工作就是要找出顧客流失的原因。我們可以通過數(shù)據(jù)挖掘技術(shù)實現(xiàn)這一目標。
現(xiàn)以電信公司判斷用戶離網(wǎng)的可能性來做分析,首先進行數(shù)據(jù)準備,抽取一定量的用戶信息,提取的信息主要包括:用戶號碼、用戶類型、用戶狀態(tài)、話費性質(zhì)(長話/市話)、欠費情況、投訴次數(shù)等,利用這些數(shù)據(jù),我們來建立判斷用戶離網(wǎng)可能性的模型。
在數(shù)據(jù)準備和適當?shù)念A處理之后,我們采用決策樹中的C4.5算法建立決策樹模型。這里,我們引入了信息論中的信息增益率的概念并以此作為屬性選擇的標準,其核心是在決策樹的各級節(jié)點上選擇屬性時用信息增益率作為屬性選擇標準。通過計算這些屬性的信息增益率,找出野投訴次數(shù)冶屬性作為決策樹的根節(jié)點。擴展決策樹節(jié)點,進行分枝,其他中間節(jié)點也是選擇各節(jié)點檢測屬性增益最大的屬性,同級的預選屬性的增益相同時,規(guī)定選擇屬性值個數(shù)較少的屬性作為當前節(jié)點的分枝,最后,我們可以生成一棵決策樹。生成的決策樹還需要進行進一步驗證,才能最終得到可用的分類模型。選擇一些具有共同特征的已離網(wǎng)用戶作為測試數(shù)據(jù),輸入屬性值進行離網(wǎng)判斷,檢驗模型的正確性,生成最終的決策樹模型。使用生成的決策樹模型,對比用戶的信息是否貼近離網(wǎng)用戶的特征屬性值,能大致預測出該用戶的離網(wǎng)可能性,對離網(wǎng)可能性高的用戶,根據(jù)其特征屬性進行挽留工作,從而預防、減少客戶的流失。
三、結(jié)束語
在企業(yè)客戶關(guān)系管理系統(tǒng)中有效利用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù),可以為企業(yè)高層決策者提供準確的客戶分類、忠誠度、贏利能力及潛在用戶等有用信息,指導他們制訂最優(yōu)的企業(yè)營銷策略、降低銀行運營成本、增加利潤,加速企業(yè)的發(fā)展。相信未來會有更多的行業(yè)加入使用客戶關(guān)系管理的行列中,通過數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)挖掘出對自身發(fā)展有用的信息,也必使客戶關(guān)系管理的目標得到更好的實現(xiàn)。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領(lǐng)域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://m.kaqidy.com/
本文標題:論企業(yè)客戶關(guān)系管理系統(tǒng)CRM/ERP中數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的作用
本文網(wǎng)址:http://m.kaqidy.com/html/consultation/1082069184.html