|
數(shù)據(jù)挖掘在企業(yè)當中的應用 |
作者:佚名 來源:網(wǎng)絡(luò) |
您的企業(yè)適用嗎? 當今世界,所有行業(yè)都面臨激烈的競爭環(huán)境,及時做出正確決策是企業(yè)生存與發(fā)展的重要環(huán)節(jié)。隨著競爭越來越激烈,利潤的降低使得很多企業(yè)必須從粗放經(jīng)營轉(zhuǎn)變到集約經(jīng)營。經(jīng)營決策需要盡可能多的定量分析,而不是似是而非的定性分析;經(jīng)營決策還需要盡可能快的速度,所有這些都需要技術(shù)上的支持。 ERP、CRM、OA等信息系統(tǒng)的廣泛應用以及互聯(lián)網(wǎng)的蓬勃發(fā)展,使得企業(yè)數(shù)據(jù)量激增,人們希望獲得更高層次的數(shù)據(jù)分析能力,F(xiàn)在,大多數(shù)企業(yè)并不缺少數(shù)據(jù),而是苦惱于海量數(shù)據(jù)以及數(shù)據(jù)的不一致性;隨著數(shù)據(jù)量的增加,數(shù)據(jù)變得越來越難以訪問、管理。如何把已有的海量數(shù)據(jù)轉(zhuǎn)換成更有價值的商用信息,以便用于決策支持呢?數(shù)據(jù)倉庫被廣泛認為是最好的解決方案之一。 建立數(shù)據(jù)倉庫的目的,是把企業(yè)的內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)進行有效集成,為企業(yè)眾多的決策、分析人員所用。內(nèi)部數(shù)據(jù),是指通過企業(yè)業(yè)務系統(tǒng)收集到的數(shù)據(jù),這些數(shù)據(jù)可能分布在不同的數(shù)據(jù)庫和網(wǎng)絡(luò)中,正在為不同的部門服務。比如對一個制造業(yè)用戶來說,可能有財務數(shù)據(jù)、市場數(shù)據(jù)、銷售數(shù)據(jù)、人事數(shù)據(jù)以及設(shè)備檢修數(shù)據(jù)分布在不同的部門。如果這些數(shù)據(jù)是相對獨立的,則不利于企業(yè)進行全面分析。外部數(shù)據(jù),是指企業(yè)通過網(wǎng)絡(luò)收集來的相關(guān)信息。數(shù)據(jù)倉庫,就是要對這些數(shù)據(jù)進行結(jié)構(gòu)重組,并且充分考慮今后的擴展性與外部數(shù)據(jù)的接口,使得企業(yè)數(shù)據(jù)資源實現(xiàn)更大的價值。 了解了數(shù)據(jù)倉庫的用途,還要明白自身企業(yè)的狀況,這才能稱為“知己知彼”。你的企業(yè)是否可以引入數(shù)據(jù)倉庫呢?數(shù)據(jù)倉庫,需要足夠龐大的歷史數(shù)據(jù)積累,還要保證及時補充最新的業(yè)務數(shù)據(jù)。為此,你還要有一個性能良好的運算環(huán)境、存儲環(huán)境以及網(wǎng)絡(luò)環(huán)境做支持。當然,“足夠龐大”這個詞語對于不同規(guī)格的企業(yè)有不同的含義。謹慎規(guī)劃,選擇一個適當規(guī)模的數(shù)據(jù)倉庫,不要設(shè)計出一個不切實際的龐然大物,那會成為你財政預算的黑洞。 數(shù)據(jù)倉庫到底如何用? 金融、電信、保險、零售,這些都是數(shù)據(jù)倉庫常見的應用行業(yè)。行業(yè)不同,具體應用形式差別也很大,這里我們只能探究其帶有共性的部分。 借助數(shù)據(jù)倉庫,企業(yè)能夠從海量信息中探究尋數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系。這種關(guān)系,一般顯示數(shù)據(jù)組之間相似或相反的行為或變化。企業(yè)決策者,則有可能從這些發(fā)掘出來的關(guān)系得到啟示;而這種啟示又很可能使得決策者贏得競爭優(yōu)勢。例如,在開展促銷活動的時候,電信運營商可以利用數(shù)據(jù)倉庫找到需要特定服務的目標用戶(例如有可能成為無線局域網(wǎng)用戶的顧客),有針對性地對其進行宣傳;這比傳統(tǒng)方式采用的地毯式廣告轟炸要高明得多。要知道,在午餐的時候收到一個不請自來的廣告電話,宣傳的卻是跟自己毫無關(guān)系的服務,這會讓很多人感到厭煩。 數(shù)據(jù)倉庫的重要用途之一,就是生成報表。與傳統(tǒng)的交互式數(shù)據(jù)庫系統(tǒng)不同,數(shù)據(jù)倉庫的使用者一般不可能更改數(shù)據(jù),這使得利用數(shù)據(jù)倉庫產(chǎn)生報表的時候可以“隨心所欲”,不用擔心破壞了數(shù)據(jù)的完整性。數(shù)據(jù)倉庫還有一個明顯的優(yōu)勢是,它的表都是為了快速響應而特別優(yōu)化的。查詢很多行的信息,往往也只是需要幾分鐘而已。如果你的職務要求你經(jīng)常處理海量信息,數(shù)據(jù)倉庫也許是你最好的報表工具。通過查詢工具,你可以把數(shù)據(jù)倉庫挖掘的信息導入到你的個人電腦中。數(shù)據(jù)本地化存儲之后,你可以將其改造成你喜歡的格式;蛘,你可以把查詢結(jié)果導入到其它軟件之中,例如Excel,以進行進一步加工。 針對不同層次的用戶,數(shù)據(jù)倉庫可以開發(fā)如下幾種應用: 即席查詢系統(tǒng):這是應用最普遍的一種查詢,可以讓用戶隨時獲取所希望的數(shù)據(jù)。它能夠提供從多個角度的靈活查詢,適合于業(yè)務分析人員。 聯(lián)機分析處理系統(tǒng):能夠提供靈活豐富的多維分析與查詢環(huán)境,可以從不同角度去分析企業(yè)的運作情況,并對未來進行預測,主要適合企業(yè)中層領(lǐng)導以及業(yè)務分析人員。 領(lǐng)導信息系統(tǒng):這是為那些不太熟悉計算機技術(shù)的領(lǐng)導人員設(shè)計的,需要以簡單的圖形界面來提供訪問數(shù)據(jù)倉庫能力。它能夠提供易于定制的決策分析環(huán)境,主要適合企業(yè)高層決策者使用。 業(yè)務流程重整:這是指利用數(shù)據(jù)倉庫技術(shù),改善企業(yè)業(yè)務流程中的某些工作,也是數(shù)據(jù)倉庫的重要作用之一,著名的例子就是“尿布與啤酒”。 當然,一個完整的數(shù)據(jù)倉庫系統(tǒng),應該是綜合了企業(yè)內(nèi)部數(shù)據(jù)與外部數(shù)據(jù),并可以提供以上諸多應用功能的系統(tǒng)。 回避常見陷阱 數(shù)據(jù)倉庫這樣的龐然大物,建設(shè)起來務必要小心。下面幾個建議,涉及到建設(shè)數(shù)據(jù)倉庫最常見的若干問題,也許可以助你一臂之力。 殺雞別用宰牛刀 如果殺雞用了宰牛刀,那不是宰牛刀的錯誤,只能怪罪操作者。 不要貪大求全 不要把所有能找到的數(shù)據(jù)都放到數(shù)據(jù)倉庫中,憑借數(shù)據(jù)倉庫,企業(yè)也并不能預知商務活動中所有的事情。不要把你能拿到的所有數(shù)據(jù)都一股腦扔入數(shù)據(jù)倉庫。要保證關(guān)鍵信息的及時、準確,例如客戶信息、產(chǎn)品信息、財政報表、人事信息,處理好這些信息比一味貪大求全要有意義。把無關(guān)緊要的數(shù)據(jù)都放到數(shù)據(jù)倉庫中,很快就會導致過于龐大的數(shù)據(jù)庫,響應緩慢、難于維護,這使得數(shù)據(jù)倉庫華而不實,難以使用。 數(shù)據(jù)挖掘是近年來數(shù)據(jù)庫應用領(lǐng)域中相當熱門的話題。數(shù)據(jù)挖掘一般是指在數(shù)據(jù)庫或數(shù)據(jù)倉庫中,利用各種分析方法與技術(shù),對過去累積的大量繁雜數(shù)據(jù)進行分析、歸納與整合等工作,提取出有用的信息,例如趨勢、模式及相關(guān)性等,并將其中有價值的信息作為決策參考提供給決策者。通俗地說,數(shù)據(jù)挖掘就是從數(shù)據(jù)中發(fā)掘信息或知識,有人稱為知識發(fā)現(xiàn),也有人稱為數(shù)據(jù)考古學、數(shù)據(jù)模式分析或功能相依分析。目前,數(shù)據(jù)挖掘已經(jīng)成為數(shù)據(jù)庫系統(tǒng)、機器學習、統(tǒng)計方法等多個學科相互交叉的重要領(lǐng)域,而在實務界,越來越多的企業(yè)開始認識到,實施數(shù)據(jù)挖掘可以為企業(yè)帶來更多潛在的商業(yè)機會。 但我們對數(shù)據(jù)挖掘應有一個正確的認知:數(shù)據(jù)挖掘不是一個無所不能的魔法。數(shù)據(jù)挖掘的種種工具都是從數(shù)據(jù)中發(fā)掘出各種可能成立的“預言”,并對其潛在價值加以“估計”,但數(shù)據(jù)挖掘本身并不能在實際中查證和確認這些假設(shè),也不能判斷這些假設(shè)的實際價值。 ..
|
|