現(xiàn)代的企業(yè)日常搜集了大量資料.包括市場、客戶、供貨商、競爭對手以及未來趨勢等重要信息。但是信息的超載與無結(jié)構(gòu)化,使得企業(yè)決策單位無法有效利用現(xiàn)存的信息,甚至使決策行為產(chǎn)生混亂與誤用。妥善地運(yùn)用數(shù)據(jù)挖掘技術(shù),從巨量的數(shù)據(jù)庫中發(fā)掘出不同的信息與知識(shí)供決策支持所用,必能產(chǎn)生企業(yè)的競爭優(yōu)勢。但是,許多企業(yè)在信息化進(jìn)程中對數(shù)據(jù)挖掘還存在一定的認(rèn)識(shí)誤區(qū),對其角色定位還不甚清晰,這直接影響了數(shù)據(jù)挖掘技術(shù)的應(yīng)用效果。
一、數(shù)據(jù)挖掘在企業(yè)信息化中的應(yīng)用現(xiàn)狀
數(shù)據(jù)挖掘在企業(yè)中的應(yīng)用方式目前主要集中在市場推廣方面。如客戶特征、購物關(guān)聯(lián)分析及客戶關(guān)系管理。世界范圍內(nèi)具有刨新性的公司都開始采用數(shù)據(jù)挖掘技術(shù)來判斷哪些是他們最有價(jià)值的客戶.并重新制定產(chǎn)品推廣策略,即把產(chǎn)品推廣給最需要的人,以用最小的花費(fèi)得到最好的銷售。在客戶特征方面.數(shù)據(jù)挖掘可以從現(xiàn)有客戶數(shù)據(jù)中找出他們的特征.再利用這些特征到潛在客戶數(shù)據(jù)庫里去篩選出可能成為客戶的名單,行銷人員就可以只針對這些名單寄發(fā)廣告數(shù)據(jù),以降低成本,提高行銷的成功率;購物關(guān)聯(lián)分析主要是用來幫助零售業(yè)者了解客戶的消費(fèi)行為,利用數(shù)據(jù)挖掘,零售業(yè)者可以更有效地決定進(jìn)貨量或庫存量,或是如何擺設(shè)貨品,同時(shí)也可以用來評估促銷活動(dòng)的成效;在客戶關(guān)系管理中,利用數(shù)據(jù)挖掘可以由原客戶后來卻轉(zhuǎn)成競爭對手的客戶群中。分析其特征,再根據(jù)分析結(jié)果到現(xiàn)有客戶資料中找出可能轉(zhuǎn)向的客戶,然后設(shè)計(jì)一些方法預(yù)防客戶流失。此外,數(shù)據(jù)挖掘還可以對銷售數(shù)據(jù)進(jìn)行深層次的分析,采掘隱含在數(shù)據(jù)中的有用信息,發(fā)現(xiàn)和把握新的市場機(jī)會(huì),為企業(yè)的管理決策提供科學(xué)的依據(jù)。
可見,數(shù)據(jù)挖掘主要用于企業(yè)的決策支持、客戶關(guān)系管理、市場分析、營銷策略和趨勢預(yù)測等方面,它可以提供比較可靠的依據(jù),使企業(yè)的決策走向科學(xué)化,而不再單純依賴經(jīng)驗(yàn),應(yīng)用的行業(yè)包括金融業(yè)、電信業(yè)、零售商、直效行銷、制造業(yè)、醫(yī)療保健及制藥業(yè)等。在我國,許多企業(yè)如電信公司、銀行等開始向數(shù)據(jù)挖掘的方向走,但由于剛起步,許多企業(yè)對數(shù)據(jù)挖掘的認(rèn)識(shí)還存在誤區(qū),對它的角色定位還不夠準(zhǔn)確。
二、企業(yè)信息化進(jìn)程中對數(shù)據(jù)挖掘的認(rèn)識(shí)誤區(qū)
1.數(shù)據(jù)挖掘可以解決企業(yè)中所有的商業(yè)信息問題
事實(shí)上,數(shù)據(jù)挖掘并非能解決企業(yè)中所有的商業(yè)信息問題,數(shù)據(jù)挖掘僅是一個(gè)工具,在挖掘信息之前仍然需要了解企業(yè)的業(yè)務(wù),理解企業(yè)的數(shù)據(jù),弄清分析方法。數(shù)據(jù)挖掘只是幫助企業(yè)更深入、更容易地分析數(shù)據(jù),它無法告訴你某個(gè)模型對企業(yè)的實(shí)際價(jià)值。因此,提及數(shù)據(jù)挖掘,企業(yè)應(yīng)首先考慮用數(shù)據(jù)挖掘解決什么樣的商業(yè)問題,是進(jìn)行客戶群體劃分、背景分析、交叉銷售,還是客戶流失性分析、客戶信用記分、欺詐發(fā)現(xiàn)等。不同的商業(yè)問題,需要用不同的方法去解決,要想真正作好數(shù)據(jù)挖掘,數(shù)據(jù)挖掘工具只是其中的一個(gè)方面,沒有哪一種數(shù)據(jù)挖掘的工具可以應(yīng)付所有的要求,所以,進(jìn)行數(shù)據(jù)挖掘首先要考慮的是,準(zhǔn)確地定義所要解決的商業(yè)問題。
2.不需要對數(shù)據(jù)進(jìn)行準(zhǔn)備和了解,就能得到好的數(shù)據(jù)挖掘結(jié)果
與傳統(tǒng)的統(tǒng)計(jì)分析相比。數(shù)據(jù)挖掘的確不用專門進(jìn)行實(shí)驗(yàn)設(shè)計(jì)和調(diào)查設(shè)計(jì)。不用為確定的目的準(zhǔn)備大量的數(shù)據(jù),因?yàn)樵谶M(jìn)行數(shù)據(jù)挖掘之前已有數(shù)據(jù)庫,其目的也是不確定的。作為一種先進(jìn)的數(shù)據(jù)信息處理技術(shù),數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析的本質(zhì)區(qū)別在于它是數(shù)據(jù)關(guān)系的一個(gè)探索過程.而且多數(shù)情況下是在沒有任何假設(shè)和前提的條件下完成的。就現(xiàn)實(shí)來看。經(jīng)過幾年的信息化建設(shè),許多大中型企業(yè)已經(jīng)建立了比較完善的客戶關(guān)系管理(CRM)、ERP、OA等基礎(chǔ)信息化系統(tǒng),這種大集中系統(tǒng)已為數(shù)據(jù)挖掘準(zhǔn)備了較為成熟的條件。但直接從數(shù)據(jù)庫中截取的數(shù)據(jù)往往是冗余的、缺失的、有噪聲的,從而直接影響數(shù)據(jù)挖掘的效果。輸入數(shù)據(jù)庫中的異常數(shù)據(jù)、不相關(guān)的字段或互相沖突的字段、數(shù)據(jù)的編碼方式等,都會(huì)對數(shù)據(jù)挖掘輸出結(jié)果的質(zhì)量產(chǎn)生影響。數(shù)據(jù)挖掘最后成功與失敗,是否有經(jīng)濟(jì)效益。
3.只要有了數(shù)據(jù)挖掘工具,就能自動(dòng)挖掘出所需要的信息
這是人們常有的一個(gè)認(rèn)識(shí)誤區(qū)。數(shù)據(jù)挖掘利用了統(tǒng)計(jì)和人工智能技術(shù)的應(yīng)用程序,它把這些高深復(fù)雜的技術(shù)封裝起來,使人們不用自己掌握這些技術(shù)也能完成同樣的功能,并且更專注于自己所要解決的問題。雖然如此,人們?nèi)匀恍枰浪x用的數(shù)據(jù)挖掘工具是如何工作的。換句話說,數(shù)據(jù)挖掘永遠(yuǎn)不會(huì)替代有經(jīng)驗(yàn)的商業(yè)分析師或管理人員所起的作用,它只是提供一個(gè)強(qiáng)大的工具。數(shù)據(jù)挖掘決不會(huì)在缺乏指導(dǎo)的情況下自動(dòng)地發(fā)現(xiàn)模型。數(shù)據(jù)挖掘工具要做的就是使這些模型得到的更容易、更方便,而且有根據(jù)。比如客戶關(guān)系管理,不是只設(shè)一個(gè)客服專線,更不僅僅是把一堆客戶基本數(shù)據(jù)輸入計(jì)算機(jī)。一個(gè)完整的客戶關(guān)系管理運(yùn)作機(jī)制在相關(guān)的硬軟件系統(tǒng)功能健全的支持之前,要有大量的數(shù)據(jù)準(zhǔn)備工作與分析過程推動(dòng)。 ..
|