|
在線OA協(xié)同辦公系統(tǒng):大數(shù)據(jù)和數(shù)據(jù)挖掘在科研領(lǐng)域的發(fā)展 |
作者:佚名 來源:網(wǎng)絡(luò) |
導(dǎo)讀:在線OA協(xié)同辦公系統(tǒng)專題:大數(shù)據(jù)和數(shù)據(jù)挖掘在科研領(lǐng)域的發(fā)展:局(NASA)的Topex/Poseidon衛(wèi)星、Jason-1衛(wèi)星,以及海形圖任務(wù)/Jason-2衛(wèi)星測高儀;重力數(shù)據(jù)來自NASA/德國航空航天中心的重力恢復(fù)及氣候?qū)嶒?yàn)任務(wù);表面風(fēng)壓數(shù)據(jù)來自NASA的 QuikScat任務(wù);海平面溫度數(shù)據(jù)來自NASA/日本宇宙航空研究開發(fā)機(jī)構(gòu)的先進(jìn)微波掃描輻射計(jì)—,在線OA協(xié)同辦公系統(tǒng)專題,免費(fèi)OA協(xié)同辦公系統(tǒng) |
關(guān)鍵詞:
協(xié)同辦公
ERP軟件
檔案
客戶管理
知識管理
項(xiàng)目管理
合同管理
進(jìn)銷存
設(shè)備管理
|
大數(shù)據(jù)在看著你嗎? 除了安全和商業(yè),大數(shù)據(jù)和數(shù)據(jù)挖掘在科研領(lǐng)域也正在風(fēng)起云涌。越來越多的設(shè)備帶著更加精密的傳感器,傳回愈發(fā)難以駕馭的數(shù)據(jù)流,于是人們需要日益強(qiáng)大的分析能力。在氣象學(xué)、石油勘探和天文學(xué)等領(lǐng)域,數(shù)據(jù)量的井噴式增長對更高層次的分析和洞察提供了支持,甚至提出了要求。 2005年6月至2007年12月海洋表面洋流示意圖。數(shù)據(jù)源:海面高度數(shù)據(jù)來自美國航空航天局 (NASA)的Topex/Poseidon衛(wèi)星、Jason-1衛(wèi)星,以及海形圖任務(wù)/Jason-2衛(wèi)星測高儀;重力數(shù)據(jù)來自NASA/德國航空航天中心的重力恢復(fù)及氣候?qū)嶒?yàn)任務(wù);表面風(fēng)壓數(shù)據(jù)來自NASA的 QuikScat任務(wù);海平面溫度數(shù)據(jù)來自NASA/日本宇宙航空研究開發(fā)機(jī)構(gòu)的先進(jìn)微波掃描輻射計(jì)——地球觀測系統(tǒng);海冰濃度和速度數(shù)據(jù)來自被動(dòng)微波輻射計(jì);溫度和咸度分布來自船載、系泊式測量儀器,以及國際Argo海洋觀測系統(tǒng)。 這幅2005年6月至2007年12月海洋表面洋流的示意圖集成了帶有數(shù)值模型的衛(wèi)星數(shù)據(jù)。漩渦和窄洋流在海洋中傳送熱量和碳。海洋環(huán)流和氣候評估項(xiàng)目提供了所有深度的洋流,但這里僅僅使用了表層洋流。這些示意圖用來測量海洋在全球碳循環(huán)中的作用,并監(jiān)測地球系統(tǒng)的不同部分內(nèi)部及之間的熱量、水和化學(xué)交換。 在醫(yī)學(xué)領(lǐng)域,2003年算是大數(shù)據(jù)涌現(xiàn)過程中的一個(gè)里程碑。那一年第一例人類基因組完成了測序。那次突破性的進(jìn)展之后,數(shù)以千計(jì)人類、靈長類、老鼠和細(xì)菌的基因組擴(kuò)充著人們所掌握的數(shù)據(jù)。每個(gè)基因組上有幾十億個(gè)“字母”,計(jì)算時(shí)出現(xiàn)紕漏的危險(xiǎn),催生了生物信息學(xué)。這一學(xué)科借助軟件、硬件以及復(fù)雜算法之力,支撐著新的科學(xué)類型。 精神障礙通常是具體病例具體分析,但是一項(xiàng)對150萬名病人病例的研究表明,相當(dāng)多的病人患有超過同一種疾病。芝加哥大學(xué)的西爾維奧·康特中心利用數(shù)據(jù)挖掘理解神經(jīng)精神障礙的成因以及之間的關(guān)系。“好幾個(gè)(研究)團(tuán)隊(duì)都在致力于這個(gè)問題的解決!敝行闹魅伟驳铝摇げ袼够ˋndrey Rzhetsky)說,“我們正試圖把它們?nèi)考{入模型,統(tǒng)一分析那些數(shù)據(jù)類型……尋找可能的環(huán)境因素! 另一例生物信息學(xué)的應(yīng)用來自美國國家癌癥研究所。該所的蘇珊·霍爾貝克(Susan Holbeck)在60種細(xì)胞系上測試了5000對美國食品和藥品管理局批準(zhǔn)的抗癌藥品。經(jīng)過30萬次試驗(yàn)之后,霍爾貝克說:“我們知道每種細(xì)胞系里面每 一條基因的RNA表達(dá)水平。我們掌握了序列數(shù)據(jù)、蛋白質(zhì)數(shù)據(jù),以及微觀RNA表達(dá)的數(shù)據(jù)。我們可以取用所有這些數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,看一看為什么一種細(xì)胞系對混合藥劑有良好的反應(yīng),而另一種沒有。我們可以抽取一對觀察結(jié)果,開發(fā)出合適的靶向藥品,并在臨床測試。” 互聯(lián)網(wǎng)上的火眼金睛 當(dāng)醫(yī)學(xué)家忙于應(yīng)對癌癥、細(xì)菌和病毒之時(shí),互聯(lián)網(wǎng)上的政治言論已呈燎原之勢。整個(gè)推特圈上每天要出現(xiàn)超過5億條推文,其政治影響力與日俱增,使廉潔政府團(tuán)體面臨著數(shù)據(jù)挖掘技術(shù)帶來的巨大挑戰(zhàn)。 印第安納大學(xué)Truthy(意:可信)項(xiàng)目的目標(biāo)是從這種每日的信息泛濫中發(fā)掘出深層意義,博士后研究員埃米利奧·費(fèi)拉拉(Emilio Ferrara)說!癟ruthy是一種能讓研究者研究推特上信息擴(kuò)散的工具。通過識別關(guān)鍵詞以及追蹤在線用戶的活動(dòng),我們研究正在進(jìn)行的討論。” Truthy是由印第安納研究者菲爾·孟澤(Fil Menczer)和亞力桑德羅·弗拉米尼(Alessandro Flammini)開發(fā)的。每一天,該項(xiàng)目的計(jì)算機(jī)過濾多達(dá)5千萬條推文,試圖找出其中蘊(yùn)含的模式。 大數(shù)據(jù)盯著“#bigdata”(意為大數(shù)據(jù))。這些是在推特上發(fā)布過“bigdata”的用戶之間的連接,用戶圖標(biāo)的尺寸代表了其粉絲數(shù)多寡。藍(lán)線表示一次回復(fù)或者提及,綠線表示一個(gè)用戶是另一個(gè)的粉絲。 一個(gè)主要的興趣點(diǎn)是“水軍”,費(fèi)拉拉說:協(xié)調(diào)一致的造勢運(yùn)動(dòng)本應(yīng)來自草根階層,但實(shí)際上是由“熱衷傳播虛假信息的個(gè)人和組織”發(fā)起的。 2012年美國大選期間,一系列推文聲稱共和黨總統(tǒng)候選人米特·羅姆尼(Mitt Romney)在臉譜網(wǎng)上獲得了可疑的大批粉絲!罢{(diào)查者發(fā)現(xiàn)共和黨人和民主黨人皆與此事無關(guān)!辟M(fèi)拉拉說,“幕后另有主使。這是一次旨在令人們相信羅姆尼在買粉從而抹黑他的造勢運(yùn)動(dòng)! 水軍的造勢運(yùn)動(dòng)通常很有特點(diǎn),費(fèi)拉拉說!耙氚l(fā)起一場大規(guī)模的抹黑運(yùn)動(dòng),你需要很多推特賬號,”包括由程序自動(dòng)運(yùn)行、反復(fù)發(fā)布選定信息的假賬號。“我們通過分析推文的特征,能夠辨別出這種自動(dòng)行為! 推文的數(shù)量年復(fù)一年地倍增,有什么能夠保證線上政治的透明呢?“我們這個(gè)項(xiàng)目的目的是讓技術(shù)掌握一點(diǎn)這樣的信息!辟M(fèi)拉拉說,“找到一切是不可能的,但哪怕我們能夠發(fā)現(xiàn)一點(diǎn),也比沒有強(qiáng)! 擴(kuò)展閱讀:OA辦公系統(tǒng)_協(xié)同辦公系統(tǒng);免費(fèi)OA協(xié)同辦公系統(tǒng)專題;在線OA協(xié)同辦公系統(tǒng)專題;..局(NASA)的Topex/Poseidon衛(wèi)星、Jason-1衛(wèi)星,以及海形圖任務(wù)/Jason-2衛(wèi)星測高儀;重力數(shù)據(jù)來自NASA/德國航空航天中心的重力恢復(fù)及氣候?qū)嶒?yàn)任務(wù);表面風(fēng)壓數(shù)據(jù)來自NASA的 QuikScat任務(wù);海平面溫度數(shù)據(jù)來自NASA/日本宇宙航空研究開發(fā)機(jī)構(gòu)的先進(jìn)微波掃描輻射計(jì)—..
|
|