關(guān)于實(shí)現(xiàn)知識庫智能檢索的技術(shù)說明
知識管理中心通過對公司現(xiàn)有知識資料的梳理,已經(jīng)建立了龐大的數(shù)據(jù)系統(tǒng),現(xiàn)在最大的問題是數(shù)據(jù)的檢索成為知識庫發(fā)揮最大效率的短板,根據(jù)知管中心要求、內(nèi)部員工使用反饋,特制定以下解決方案,以供參考:
第一步:實(shí)現(xiàn)上傳附件同時自動生成附件摘要; 自動從word、ppt、excel、txt等文件中獲取摘要信息,為下一步的全文檢索建立基礎(chǔ),當(dāng)然,也可以跳過這一步,采用現(xiàn)有手動加標(biāo)簽的方式實(shí)現(xiàn)全文檢索。但是自動索引機(jī)建立摘要是發(fā)展的趨勢、適合大量數(shù)據(jù)的處理、檢索結(jié)果也更精準(zhǔn); 開發(fā)難點(diǎn):需要編寫程序自動從word、ppt、excel、txt等獲得文本信息并生成摘要,類似百度等搜索引擎采集原始數(shù)據(jù)存入數(shù)據(jù)庫并建立索引;
第二步:實(shí)現(xiàn)全文檢索; 現(xiàn)有系統(tǒng)僅支持單個詞語的模糊檢索及多個詞語的簡單檢索,而全文檢索可以實(shí)現(xiàn)全方位的檢索,具體功能參照百度、谷歌等搜索引擎,可以實(shí)現(xiàn)任意詞組的組合查詢; 開發(fā)難點(diǎn):中文分詞及語境分析是全文檢索的難點(diǎn),也是各個搜索引擎核心技術(shù),目前我們也已經(jīng)開發(fā)自己的分詞技術(shù)并取得了不錯的效果;
第三步:建立在線文庫; 在實(shí)現(xiàn)全文檢索的基礎(chǔ)上可以直接在線預(yù)覽,形成在線文庫,具體功能參照百度文庫; 開發(fā)難點(diǎn):通過程序自動將各類文件轉(zhuǎn)化成可以在線預(yù)覽的文件并建立索引;
通過以上幾個步驟,可以實(shí)現(xiàn)知識庫高效、全方位的應(yīng)用,最終建立起類似百度網(wǎng)頁檢索、百度文庫等高級應(yīng)用系統(tǒng)。
【正-文-結(jié)-束】
建筑行業(yè)知識管理系統(tǒng)選型法則偉創(chuàng)軟件 -> 知識管理系統(tǒng)作用很多,公司對知識管理系統(tǒng)要求也趨向人性化,是考慮人性化要求還是主要關(guān)鍵要求,變成知識管理系統(tǒng)型號選擇的難題。顯而易見,提升全體人員的工作效能并不是靠某一單位、某一領(lǐng)導(dǎo)干部、某一人的高效率,只是靠顧客保持知識管理系統(tǒng)關(guān)鍵作用功效的結(jié)果,因此重視知識管理系統(tǒng)的核心理念,變成知識管理系統(tǒng)作用挑選的規(guī)范。..
|