企業(yè)做網(wǎng)站Lucene的基礎(chǔ)信息
日期 : 2021-01-03 16:55:31
Lucene的基礎(chǔ)信息。Document是Lucene對(duì)文檔的抽象, 用于存儲(chǔ)被索引數(shù)據(jù)信息。
搜索引擎的結(jié)果呈現(xiàn)實(shí)質(zhì)就是一個(gè)Document列表。Field是Document中細(xì)化出來(lái)的表示節(jié)點(diǎn)信息的類。在Lucene中用存儲(chǔ)和索引兩個(gè)屬性來(lái)約束Field, 在實(shí)際應(yīng)用中一般用兩個(gè)屬性的組合來(lái)實(shí)現(xiàn)業(yè)務(wù)邏輯。
Term是對(duì)現(xiàn)實(shí)中詞語(yǔ)的封裝, 是搜索過(guò)程中的最小單位, 在term中一般記錄兩類信息, 一類是詞語(yǔ), 另一類是父節(jié)點(diǎn)信息, 即Field的信息。Lucene把單詞的一次出現(xiàn)定義為Tocken, 其中包含Term的文本信息、起止偏移。
搜索引擎的結(jié)果呈現(xiàn)實(shí)質(zhì)就是一個(gè)Document列表。Field是Document中細(xì)化出來(lái)的表示節(jié)點(diǎn)信息的類。在Lucene中用存儲(chǔ)和索引兩個(gè)屬性來(lái)約束Field, 在實(shí)際應(yīng)用中一般用兩個(gè)屬性的組合來(lái)實(shí)現(xiàn)業(yè)務(wù)邏輯。
Term是對(duì)現(xiàn)實(shí)中詞語(yǔ)的封裝, 是搜索過(guò)程中的最小單位, 在term中一般記錄兩類信息, 一類是詞語(yǔ), 另一類是父節(jié)點(diǎn)信息, 即Field的信息。Lucene把單詞的一次出現(xiàn)定義為Tocken, 其中包含Term的文本信息、起止偏移。