大數(shù)據(jù)的定義是高科技領(lǐng)域內(nèi)非常精細的事件驅(qū)動數(shù)據(jù)的采集和分析。這涉及到互聯(lián)網(wǎng)的派生數(shù)據(jù),這些派生數(shù)據(jù)的規(guī)模遠遠超出了網(wǎng)站的分析能力。它還與傳感器數(shù)據(jù)相關(guān),而對于大部分傳感器數(shù)據(jù)我們直到最近才丟棄,F(xiàn)在,那些有很大價值的數(shù)據(jù),將更有利于我們深入了解業(yè)務運轉(zhuǎn)和與客戶的互動。對我來說,這才是能否被稱為大數(shù)據(jù)的標準。 但是,事件驅(qū)動數(shù)據(jù)集容量實在是太大了,以致于交易數(shù)據(jù)庫系統(tǒng)不能有效地運轉(zhuǎn)。大數(shù)據(jù),如Hadoop、復雜事件處理(CEP)和大規(guī)模并行處理(MPP)系統(tǒng)是專為這種較大的工作負荷量開發(fā)出來的。未來,交易系統(tǒng)將得到改進,但它們也永遠有一個障礙,即它們并沒有被設計和應用。
大數(shù)據(jù)正在成為主流,它從科學和高科技公司的專用技術(shù)轉(zhuǎn)變?yōu)槠髽I(yè)IT應用程序的專用技術(shù)。大數(shù)據(jù)作為IT工具的主流,對IT領(lǐng)域有重大的影響,其可用性和易安裝標準是高于科學與高科技公司界對大數(shù)據(jù)的要求的。這就是為什么我們會看到像微軟這樣的公司,可以通過Web瀏覽器來實現(xiàn)利用云基礎大數(shù)據(jù)技術(shù),從而進軍游戲行業(yè)。 為了更好的使大數(shù)據(jù)與企業(yè)相融合,我們應該實現(xiàn)技術(shù)的細化和降低經(jīng)營成本。眼下,很多大數(shù)據(jù)工具都是粗糙的或昂貴的,或者是需要能夠?qū)嵤┎僮鞯母叨葘I(yè)化的技術(shù)人員的輔助。不過,這種情況正在逐漸改變,而且,它從側(cè)面也證明了大數(shù)據(jù)革命的光明前景。 Spreadmarts不是大數(shù)據(jù),但他們也有自己的作用大數(shù)據(jù)和我們習慣使用的電子表格模型和數(shù)量運算有什么不同嗎?電子表格技術(shù)員們一直在做分析,但肯定不是大數(shù)據(jù),因為Excel不符合前面對大數(shù)據(jù)集的定義。直到2007年,Excel才可以處理超過有16,384行的電子表格。但是,它還是不能處理較大的業(yè)務數(shù)據(jù)量,這方面它比大數(shù)據(jù)遜色許多。 當然,大數(shù)據(jù)分析的結(jié)果可以利用Excel來進一步計算和探討。事實上,微軟已經(jīng)開發(fā)了一個與Excel連接的附件,與Hadoop連接的數(shù)據(jù)倉庫接口,還有象征性的大數(shù)據(jù)技術(shù)。大數(shù)據(jù)工作就像經(jīng)過以Excel為基礎的分析和粗糙的編輯之后的后期制作。 從另一方面上看,BI(商務智能)和DW(數(shù)據(jù)倉庫)是相輔相成的,這對大數(shù)據(jù)而言是一件好事。大數(shù)據(jù)讓落后的、傳統(tǒng)的技術(shù),為涵蓋比以前更廣的操作和交互范圍的數(shù)據(jù)集提供見解。我們可以在全新的環(huán)境下繼續(xù)使用熟悉的工具,從而實現(xiàn)對看似不可能或隨意的事情的訪問。
|