關(guān)于實(shí)現(xiàn)知識(shí)庫(kù)智能檢索的技術(shù)說(shuō)明
知識(shí)管理中心通過(guò)對(duì)公司現(xiàn)有知識(shí)資料的梳理,已經(jīng)建立了龐大的數(shù)據(jù)系統(tǒng),現(xiàn)在最大的問(wèn)題是數(shù)據(jù)
的檢索成為知識(shí)庫(kù)發(fā)揮最大效率的短板,根據(jù)知管中心要求、內(nèi)部員工使用反饋,特制定以下解決方案,以供參考:
第一步:知識(shí)庫(kù)系統(tǒng)實(shí)現(xiàn)上傳附件同時(shí)自動(dòng)生成附件摘要; 自動(dòng)從word、ppt、
excel、txt等文件中獲取摘要信息,為下一步的全文檢索建立基礎(chǔ),當(dāng)然,也可以跳過(guò)這一步,采用現(xiàn)有手動(dòng)加標(biāo)簽的方式實(shí)現(xiàn)全
文檢索。但是自動(dòng)索引機(jī)建立摘要是發(fā)展的趨勢(shì)、適合大量數(shù)據(jù)的處理、檢索結(jié)果也更精準(zhǔn); 開(kāi)發(fā)難點(diǎn):需要編寫(xiě)程
序自動(dòng)從word、ppt、excel、txt等獲得文本信息并生成摘要,類(lèi)似百度等搜索引擎采集原始數(shù)據(jù)存入數(shù)據(jù)庫(kù)并建立索引;
第二步:知識(shí)庫(kù)系統(tǒng)實(shí)現(xiàn)全文檢索; 現(xiàn)有系統(tǒng)僅支持單個(gè)詞語(yǔ)的模糊檢索及多個(gè)
詞語(yǔ)的簡(jiǎn)單檢索,而全文檢索可以實(shí)現(xiàn)全方位的檢索,具體功能參照百度、谷歌等搜索引擎,可以實(shí)現(xiàn)任意詞組的組合查詢;
開(kāi)發(fā)難點(diǎn):中文分詞及語(yǔ)境分析是全文檢索的難點(diǎn),也是各個(gè)搜索引擎核心技術(shù),目前我們也已經(jīng)開(kāi)發(fā)自己的分詞技
術(shù)并取得了不錯(cuò)的效果;
第三步:知識(shí)庫(kù)系統(tǒng)建立在線文庫(kù); 在實(shí)現(xiàn)全文檢索的
基礎(chǔ)上可以直接在線預(yù)覽,形成在線文庫(kù),具體功能參照百度文庫(kù); 開(kāi)發(fā)難點(diǎn):通過(guò)程序自動(dòng)將各類(lèi)文件轉(zhuǎn)化成可以
在線預(yù)覽的文件并建立索引;
通過(guò)以上幾個(gè)步驟,可以實(shí)現(xiàn)知識(shí)庫(kù)高效、全方位的應(yīng)用,最終建立起
類(lèi)似百度網(wǎng)頁(yè)檢索、百度文庫(kù)等高級(jí)應(yīng)用系統(tǒng)。
OA辦公系統(tǒng),協(xié)同辦公系統(tǒng),某公司知識(shí)庫(kù)系統(tǒng)智能檢索實(shí)施步驟,北京知識(shí)管理系統(tǒng),用反饋,特制定以下解決方案,以供參考:
第一步:知識(shí)庫(kù)系統(tǒng)實(shí)現(xiàn)上傳附件同時(shí)自動(dòng)生成附件摘要;自動(dòng)從word、ppt、
excel、txt等文件中獲取摘要信息,為下一步的全文檢索建立基礎(chǔ),當(dāng)然,也可以跳過(guò)這一步,采用現(xiàn)有手動(dòng)加標(biāo)簽的方式實(shí)現(xiàn)全
文檢索。但是自動(dòng)索引機(jī)建立摘要是發(fā)展的趨..
|