1、從“基于預設(shè)的結(jié)構(gòu)化數(shù)據(jù)庫”到“無需預設(shè)的非關(guān)系型數(shù)據(jù)庫” 小數(shù)據(jù)時代,我們對于數(shù)據(jù)的存儲與檢索一直依賴于分類法和索引法,分類和索引是一種清晰獲取數(shù)據(jù)的機制設(shè)計,這種機制是以預設(shè)場域為前提的。這種結(jié)構(gòu)化數(shù)據(jù)庫的預設(shè)場域能夠卓越地展示數(shù)據(jù)的整齊排列與準確存儲,毫無疑問,這與追求數(shù)據(jù)的精確性目標是完全一致的,在數(shù)據(jù)稀缺與問題清晰的年代,這種基于預設(shè)的結(jié)構(gòu)化數(shù)據(jù)庫能夠有效的回答人們的問題,并且這種數(shù)據(jù)庫在不同的時間能夠提供一致的結(jié)果。
面對大數(shù)據(jù),由于數(shù)據(jù)的海量、混雜等特征會使預設(shè)的數(shù)據(jù)庫系統(tǒng)崩潰。其實,數(shù)據(jù)的紛繁雜亂才真正呈現(xiàn)出世界的復雜性和不確定性特征,想要獲得大數(shù)據(jù)的價值,承認混亂而不是對抗或避免混亂才是一種可行的路徑。為此,伴隨著大數(shù)據(jù)的涌現(xiàn),出現(xiàn)了非關(guān)系型數(shù)據(jù)庫,它不需要預先設(shè)定記錄結(jié)構(gòu),而且允許處理各種各樣形形色色參差不齊的數(shù)據(jù)。因為包容了結(jié)構(gòu)的多樣性,這些無需預設(shè)的非關(guān)系型數(shù)據(jù)庫設(shè)計能夠處理和存儲更多的數(shù)據(jù),成為大數(shù)據(jù)時代的重要應對手段。
2、從“隨機樣本”到“全量數(shù)據(jù)” 統(tǒng)計學家通過分析發(fā)現(xiàn),采樣分析的精確性隨著采樣隨機性的增加而大幅提高,但與樣本數(shù)量的增加關(guān)系不大。這個發(fā)現(xiàn)對于小數(shù)據(jù)時代無疑是非常鼓舞人心的,隨機采樣獲得了巨大的成功,并成為現(xiàn)代社會測量領(lǐng)域的核心思想。隨機樣本的基礎(chǔ)是采樣的絕對隨機性,然而,如此嚴格意義的隨機實現(xiàn)起來是非常困難的,一旦采樣過程存在任何偏見,分析結(jié)果將相去甚遠,況且隨機樣本帶給我們的只能是事先預設(shè)問題的答案。這種缺乏延展性的結(jié)果,無疑會使我們錯失更多的問題域。
3、大數(shù)據(jù)時代,數(shù)據(jù)的收集問題不再成為我們的困擾,采集全量的數(shù)據(jù)成為現(xiàn)實。全量數(shù)據(jù)帶給我們視角上的宏觀與高遠,這將使我們可以站在更高的層級全貌看待問題,看見曾經(jīng)被淹沒的數(shù)據(jù)價值,發(fā)現(xiàn)藏匿在整體中有趣的細節(jié)。因為擁有全部或幾乎全部的數(shù)據(jù),就能使我們獲得從不同的角度更細致更全面的觀察研究數(shù)據(jù)的可能性,從而使得大數(shù)據(jù)的分析過程成為驚喜的發(fā)現(xiàn)過程和問題域的拓展過程。
4、從“數(shù)據(jù)的精確性和結(jié)果的準確性”到“數(shù)據(jù)的混雜性和結(jié)果的容錯性” 小數(shù)據(jù)時代,由于可獲得的數(shù)據(jù)量比較小,為此我們必須盡量準確的記錄下所獲得的所有數(shù)據(jù),從而引發(fā)了測量工具的優(yōu)化工作;由于數(shù)據(jù)處理手段的限制,能被我們利用的數(shù)據(jù)基本限于能適用于傳統(tǒng)數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù);由于采用的是隨機采樣,因此采樣過程的精確度被放在重要的地位。顯然,這種對精確性的執(zhí)著是信息缺乏時代和模擬時代的產(chǎn)物。
大數(shù)據(jù)時代,海量數(shù)據(jù)的涌現(xiàn)一定會增加數(shù)據(jù)的混亂性且造成結(jié)果的不準確性,如果仍然執(zhí)迷的依循準確性,那么我們將無法應對這個新的時代。與數(shù)據(jù)的混雜性可能帶來的結(jié)果錯誤性的增加相比,由數(shù)據(jù)量的擴張帶給我們的新洞察、新趨勢和新價值更有意義,因為大數(shù)據(jù)通常都用概率說話,何況大數(shù)據(jù)的處理之前是可以對之進行數(shù)據(jù)清洗從而減少部分的錯誤數(shù)據(jù)。
所以,與致力于避免錯誤相比,對錯誤的包容將會帶給我們更多信息。其實,允許數(shù)據(jù)的混雜性和容許結(jié)果的不精確性才是我們擁抱大數(shù)據(jù)的正確態(tài)度,只有讓步和接受甚至欣賞不精確性,才能看到大數(shù)據(jù)帶給我們的美好前景,未來我們應當習慣這種思維。
|