知識管理中心通過對公司現(xiàn)有知識資料的梳理,已經(jīng)建立了龐大的數(shù)據(jù)系統(tǒng),現(xiàn)在最大的問題是數(shù)據(jù)的檢索成為知識庫發(fā)揮最大效率的短板,根據(jù)知管中心要求、內(nèi)部員工使用反饋,特制定以下解決方案,以供參考:
==實(shí)現(xiàn)全文檢索; 現(xiàn)有系統(tǒng)僅支持單個(gè)詞語的模糊檢索及多個(gè)詞語的簡單檢索,而全文檢索可以實(shí)現(xiàn)全方位的檢索,具體功能參照百度、谷歌等搜索引擎,可以實(shí)現(xiàn)任意詞組的組合查詢; 開發(fā)難點(diǎn):中文分詞及語境分析是全文檢索的難點(diǎn),也是各個(gè)搜索引擎核心技術(shù),目前我們也已經(jīng)開發(fā)自己的分詞技術(shù)并取得了不錯(cuò)的效果;
==建立在線文庫; 在實(shí)現(xiàn)全文檢索的基礎(chǔ)上可以直接在線預(yù)覽,形成在線文庫,具體功能參照百度文庫; 開發(fā)難點(diǎn):通過程序自動將各類文件轉(zhuǎn)化成可以在線預(yù)覽的文件并建立索引;
==實(shí)現(xiàn)上傳附件同時(shí)自動生成附件摘要; 自動從word、ppt、excel、txt等文件中獲取摘要信息,為下一步的全文檢索建立基礎(chǔ),當(dāng)然,也可以跳過這一步,采用現(xiàn)有手動加標(biāo)簽的方式實(shí)現(xiàn)全文檢索。但是自動索引機(jī)建立摘要是發(fā)展的趨勢、適合大量數(shù)據(jù)的處理、檢索結(jié)果也更精準(zhǔn); 開發(fā)難點(diǎn):需要編寫程序自動從word、ppt、excel、txt等獲得文本信息并生成摘要,類似百度等搜索引擎采集原始數(shù)據(jù)存入數(shù)據(jù)庫并建立索引;
通過以下幾個(gè)步驟,可以實(shí)現(xiàn)知識庫高效、全方位的應(yīng)用,最終建立起類似百度網(wǎng)頁檢索、百度文庫等高級應(yīng)用系統(tǒng)。
..
|