網站seo優(yōu)化索引的建立
日期 : 2021-01-03 17:00:53
索引的建立。索引建立時, 使用的是Lucene的索引器Index Writer類。對Index Writer類所使用的語言分析器進行修改, 使其支持中文分詞。

這里采用了簡單的單漢字切分, 即將單個漢字作為一個術語, 利用Java CC編程實現(xiàn)。并且在生成索引器將支持中文單漢字切分的語言分析器作為參數(shù)傳遞給索引器成為索引器的成員, 使其在索引過程中使用該語言分析器進行分詞。

最后, 調用Index Write類的add Document () , 將網絡爬蟲抓取且轉換為Document格式的文件, 根據(jù)字段類型進行分別處理, 加入到索引字段。

這里采用了簡單的單漢字切分, 即將單個漢字作為一個術語, 利用Java CC編程實現(xiàn)。并且在生成索引器將支持中文單漢字切分的語言分析器作為參數(shù)傳遞給索引器成為索引器的成員, 使其在索引過程中使用該語言分析器進行分詞。

最后, 調用Index Write類的add Document () , 將網絡爬蟲抓取且轉換為Document格式的文件, 根據(jù)字段類型進行分別處理, 加入到索引字段。