|
數(shù)據(jù)挖掘在企業(yè)當(dāng)中的應(yīng)用 |
作者:佚名 來(lái)源:網(wǎng)絡(luò) |
您的企業(yè)適用嗎? 當(dāng)今世界,所有行業(yè)都面臨激烈的競(jìng)爭(zhēng)環(huán)境,及時(shí)做出正確決策是企業(yè)生存與發(fā)展的重要環(huán)節(jié)。隨著競(jìng)爭(zhēng)越來(lái)越激烈,利潤(rùn)的降低使得很多企業(yè)必須從粗放經(jīng)營(yíng)轉(zhuǎn)變到集約經(jīng)營(yíng)。經(jīng)營(yíng)決策需要盡可能多的定量分析,而不是似是而非的定性分析;經(jīng)營(yíng)決策還需要盡可能快的速度,所有這些都需要技術(shù)上的支持。 ERP、CRM、OA等信息系統(tǒng)的廣泛應(yīng)用以及互聯(lián)網(wǎng)的蓬勃發(fā)展,使得企業(yè)數(shù)據(jù)量激增,人們希望獲得更高層次的數(shù)據(jù)分析能力,F(xiàn)在,大多數(shù)企業(yè)并不缺少數(shù)據(jù),而是苦惱于海量數(shù)據(jù)以及數(shù)據(jù)的不一致性;隨著數(shù)據(jù)量的增加,數(shù)據(jù)變得越來(lái)越難以訪(fǎng)問(wèn)、管理。如何把已有的海量數(shù)據(jù)轉(zhuǎn)換成更有價(jià)值的商用信息,以便用于決策支持呢?數(shù)據(jù)倉(cāng)庫(kù)被廣泛認(rèn)為是最好的解決方案之一。 建立數(shù)據(jù)倉(cāng)庫(kù)的目的,是把企業(yè)的內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)進(jìn)行有效集成,為企業(yè)眾多的決策、分析人員所用。內(nèi)部數(shù)據(jù),是指通過(guò)企業(yè)業(yè)務(wù)系統(tǒng)收集到的數(shù)據(jù),這些數(shù)據(jù)可能分布在不同的數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)中,正在為不同的部門(mén)服務(wù)。比如對(duì)一個(gè)制造業(yè)用戶(hù)來(lái)說(shuō),可能有財(cái)務(wù)數(shù)據(jù)、市場(chǎng)數(shù)據(jù)、銷(xiāo)售數(shù)據(jù)、人事數(shù)據(jù)以及設(shè)備檢修數(shù)據(jù)分布在不同的部門(mén)。如果這些數(shù)據(jù)是相對(duì)獨(dú)立的,則不利于企業(yè)進(jìn)行全面分析。外部數(shù)據(jù),是指企業(yè)通過(guò)網(wǎng)絡(luò)收集來(lái)的相關(guān)信息。數(shù)據(jù)倉(cāng)庫(kù),就是要對(duì)這些數(shù)據(jù)進(jìn)行結(jié)構(gòu)重組,并且充分考慮今后的擴(kuò)展性與外部數(shù)據(jù)的接口,使得企業(yè)數(shù)據(jù)資源實(shí)現(xiàn)更大的價(jià)值。 了解了數(shù)據(jù)倉(cāng)庫(kù)的用途,還要明白自身企業(yè)的狀況,這才能稱(chēng)為“知己知彼”。你的企業(yè)是否可以引入數(shù)據(jù)倉(cāng)庫(kù)呢?數(shù)據(jù)倉(cāng)庫(kù),需要足夠龐大的歷史數(shù)據(jù)積累,還要保證及時(shí)補(bǔ)充最新的業(yè)務(wù)數(shù)據(jù)。為此,你還要有一個(gè)性能良好的運(yùn)算環(huán)境、存儲(chǔ)環(huán)境以及網(wǎng)絡(luò)環(huán)境做支持。當(dāng)然,“足夠龐大”這個(gè)詞語(yǔ)對(duì)于不同規(guī)格的企業(yè)有不同的含義。謹(jǐn)慎規(guī)劃,選擇一個(gè)適當(dāng)規(guī)模的數(shù)據(jù)倉(cāng)庫(kù),不要設(shè)計(jì)出一個(gè)不切實(shí)際的龐然大物,那會(huì)成為你財(cái)政預(yù)算的黑洞。 數(shù)據(jù)倉(cāng)庫(kù)到底如何用? 金融、電信、保險(xiǎn)、零售,這些都是數(shù)據(jù)倉(cāng)庫(kù)常見(jiàn)的應(yīng)用行業(yè)。行業(yè)不同,具體應(yīng)用形式差別也很大,這里我們只能探究其帶有共性的部分。 借助數(shù)據(jù)倉(cāng)庫(kù),企業(yè)能夠從海量信息中探究尋數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系。這種關(guān)系,一般顯示數(shù)據(jù)組之間相似或相反的行為或變化。企業(yè)決策者,則有可能從這些發(fā)掘出來(lái)的關(guān)系得到啟示;而這種啟示又很可能使得決策者贏得競(jìng)爭(zhēng)優(yōu)勢(shì)。例如,在開(kāi)展促銷(xiāo)活動(dòng)的時(shí)候,電信運(yùn)營(yíng)商可以利用數(shù)據(jù)倉(cāng)庫(kù)找到需要特定服務(wù)的目標(biāo)用戶(hù)(例如有可能成為無(wú)線(xiàn)局域網(wǎng)用戶(hù)的顧客),有針對(duì)性地對(duì)其進(jìn)行宣傳;這比傳統(tǒng)方式采用的地毯式廣告轟炸要高明得多。要知道,在午餐的時(shí)候收到一個(gè)不請(qǐng)自來(lái)的廣告電話(huà),宣傳的卻是跟自己毫無(wú)關(guān)系的服務(wù),這會(huì)讓很多人感到厭煩。 數(shù)據(jù)倉(cāng)庫(kù)的重要用途之一,就是生成報(bào)表。與傳統(tǒng)的交互式數(shù)據(jù)庫(kù)系統(tǒng)不同,數(shù)據(jù)倉(cāng)庫(kù)的使用者一般不可能更改數(shù)據(jù),這使得利用數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)生報(bào)表的時(shí)候可以“隨心所欲”,不用擔(dān)心破壞了數(shù)據(jù)的完整性。數(shù)據(jù)倉(cāng)庫(kù)還有一個(gè)明顯的優(yōu)勢(shì)是,它的表都是為了快速響應(yīng)而特別優(yōu)化的。查詢(xún)很多行的信息,往往也只是需要幾分鐘而已。如果你的職務(wù)要求你經(jīng)常處理海量信息,數(shù)據(jù)倉(cāng)庫(kù)也許是你最好的報(bào)表工具。通過(guò)查詢(xún)工具,你可以把數(shù)據(jù)倉(cāng)庫(kù)挖掘的信息導(dǎo)入到你的個(gè)人電腦中。數(shù)據(jù)本地化存儲(chǔ)之后,你可以將其改造成你喜歡的格式;蛘,你可以把查詢(xún)結(jié)果導(dǎo)入到其它軟件之中,例如Excel,以進(jìn)行進(jìn)一步加工。 針對(duì)不同層次的用戶(hù),數(shù)據(jù)倉(cāng)庫(kù)可以開(kāi)發(fā)如下幾種應(yīng)用: 即席查詢(xún)系統(tǒng):這是應(yīng)用最普遍的一種查詢(xún),可以讓用戶(hù)隨時(shí)獲取所希望的數(shù)據(jù)。它能夠提供從多個(gè)角度的靈活查詢(xún),適合于業(yè)務(wù)分析人員。 聯(lián)機(jī)分析處理系統(tǒng):能夠提供靈活豐富的多維分析與查詢(xún)環(huán)境,可以從不同角度去分析企業(yè)的運(yùn)作情況,并對(duì)未來(lái)進(jìn)行預(yù)測(cè),主要適合企業(yè)中層領(lǐng)導(dǎo)以及業(yè)務(wù)分析人員。 領(lǐng)導(dǎo)信息系統(tǒng):這是為那些不太熟悉計(jì)算機(jī)技術(shù)的領(lǐng)導(dǎo)人員設(shè)計(jì)的,需要以簡(jiǎn)單的圖形界面來(lái)提供訪(fǎng)問(wèn)數(shù)據(jù)倉(cāng)庫(kù)能力。它能夠提供易于定制的決策分析環(huán)境,主要適合企業(yè)高層決策者使用。 業(yè)務(wù)流程重整:這是指利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù),改善企業(yè)業(yè)務(wù)流程中的某些工作,也是數(shù)據(jù)倉(cāng)庫(kù)的重要作用之一,著名的例子就是“尿布與啤酒”。 當(dāng)然,一個(gè)完整的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),應(yīng)該是綜合了企業(yè)內(nèi)部數(shù)據(jù)與外部數(shù)據(jù),并可以提供以上諸多應(yīng)用功能的系統(tǒng)。 回避常見(jiàn)陷阱 數(shù)據(jù)倉(cāng)庫(kù)這樣的龐然大物,建設(shè)起來(lái)務(wù)必要小心。下面幾個(gè)建議,涉及到建設(shè)數(shù)據(jù)倉(cāng)庫(kù)最常見(jiàn)的若干問(wèn)題,也許可以助你一臂之力。 殺雞別用宰牛刀 如果殺雞用了宰牛刀,那不是宰牛刀的錯(cuò)誤,只能怪罪操作者。 不要貪大求全 不要把所有能找到的數(shù)據(jù)都放到數(shù)據(jù)倉(cāng)庫(kù)中,憑借數(shù)據(jù)倉(cāng)庫(kù),企業(yè)也并不能預(yù)知商務(wù)活動(dòng)中所有的事情。不要把你能拿到的所有數(shù)據(jù)都一股腦扔入數(shù)據(jù)倉(cāng)庫(kù)。要保證關(guān)鍵信息的及時(shí)、準(zhǔn)確,例如客戶(hù)信息、產(chǎn)品信息、財(cái)政報(bào)表、人事信息,處理好這些信息比一味貪大求全要有意義。把無(wú)關(guān)緊要的數(shù)據(jù)都放到數(shù)據(jù)倉(cāng)庫(kù)中,很快就會(huì)導(dǎo)致過(guò)于龐大的數(shù)據(jù)庫(kù),響應(yīng)緩慢、難于維護(hù),這使得數(shù)據(jù)倉(cāng)庫(kù)華而不實(shí),難以使用。 數(shù)據(jù)挖掘是近年來(lái)數(shù)據(jù)庫(kù)應(yīng)用領(lǐng)域中相當(dāng)熱門(mén)的話(huà)題。數(shù)據(jù)挖掘一般是指在數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中,利用各種分析方法與技術(shù),對(duì)過(guò)去累積的大量繁雜數(shù)據(jù)進(jìn)行分析、歸納與整合等工作,提取出有用的信息,例如趨勢(shì)、模式及相關(guān)性等,并將其中有價(jià)值的信息作為決策參考提供給決策者。通俗地說(shuō),數(shù)據(jù)挖掘就是從數(shù)據(jù)中發(fā)掘信息或知識(shí),有人稱(chēng)為知識(shí)發(fā)現(xiàn),也有人稱(chēng)為數(shù)據(jù)考古學(xué)、數(shù)據(jù)模式分析或功能相依分析。目前,數(shù)據(jù)挖掘已經(jīng)成為數(shù)據(jù)庫(kù)系統(tǒng)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)方法等多個(gè)學(xué)科相互交叉的重要領(lǐng)域,而在實(shí)務(wù)界,越來(lái)越多的企業(yè)開(kāi)始認(rèn)識(shí)到,實(shí)施數(shù)據(jù)挖掘可以為企業(yè)帶來(lái)更多潛在的商業(yè)機(jī)會(huì)。 但我們對(duì)數(shù)據(jù)挖掘應(yīng)有一個(gè)正確的認(rèn)知:數(shù)據(jù)挖掘不是一個(gè)無(wú)所不能的魔法。數(shù)據(jù)挖掘的種種工具都是從數(shù)據(jù)中發(fā)掘出各種可能成立的“預(yù)言”,并對(duì)其潛在價(jià)值加以“估計(jì)”,但數(shù)據(jù)挖掘本身并不能在實(shí)際中查證和確認(rèn)這些假設(shè),也不能判斷這些假設(shè)的實(shí)際價(jià)值。 ..
|
|