企業(yè)網(wǎng)站設(shè)計站內(nèi)全文檢索技術(shù)
日期 : 2019-04-28 14:31:39
隨著企業(yè)網(wǎng)站各功能模塊中信息量的逐漸增加, 如何利用關(guān)鍵詞快速地查找到所需信息也就成了網(wǎng)站要解決的關(guān)鍵問題之一。對于小型的企業(yè)網(wǎng)站來說, 由于數(shù)據(jù)量不是太大, 采用基于數(shù)據(jù)庫的模糊檢索方式就能滿足要求。但這種檢索方式只適合檢索結(jié)構(gòu)化數(shù)據(jù), 無法對文本、圖片等非結(jié)構(gòu)化數(shù)據(jù)進行檢索。而且, 在使用like查詢時, 需要對數(shù)據(jù)庫表格中相關(guān)字段的內(nèi)容全部檢索一次, 在數(shù)據(jù)量較大的環(huán)境下, like查詢對系統(tǒng)性能的影響是相當大的。
為解決傳統(tǒng)數(shù)據(jù)檢索方式存在的效率低下問題, 以Lucene為代表的站內(nèi)全文檢索技術(shù)也就應運而生。Lucene的檢索過程實際上就是把模糊查詢變成可以利用索引進行精確查詢的過程, 就如查字典, 只需要從索引目錄中找出所查字符的頁碼即可實現(xiàn)精確定位, 不需要一頁一頁的去搜尋, 極大地提升了數(shù)據(jù)檢索的效率和準確性。全文檢索的實現(xiàn)過程主要分為索引創(chuàng)建和搜索索引兩個步驟。其中, 索引創(chuàng)建就是將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的特征信息提取出來并儲存到創(chuàng)建好的索引庫中;搜索索引就是根據(jù)用戶需要查詢的關(guān)鍵詞, 從索引庫中搜索出滿足條件的記錄, 然后將查詢結(jié)果返回給用戶。
為解決傳統(tǒng)數(shù)據(jù)檢索方式存在的效率低下問題, 以Lucene為代表的站內(nèi)全文檢索技術(shù)也就應運而生。Lucene的檢索過程實際上就是把模糊查詢變成可以利用索引進行精確查詢的過程, 就如查字典, 只需要從索引目錄中找出所查字符的頁碼即可實現(xiàn)精確定位, 不需要一頁一頁的去搜尋, 極大地提升了數(shù)據(jù)檢索的效率和準確性。全文檢索的實現(xiàn)過程主要分為索引創(chuàng)建和搜索索引兩個步驟。其中, 索引創(chuàng)建就是將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的特征信息提取出來并儲存到創(chuàng)建好的索引庫中;搜索索引就是根據(jù)用戶需要查詢的關(guān)鍵詞, 從索引庫中搜索出滿足條件的記錄, 然后將查詢結(jié)果返回給用戶。