`

lucene Field部分参数设置含义

 
阅读更多
         /**
         * Field.Store.COMPRESS:压缩保存,用于长文本或二进制数据
         * Field.Store.YES:保存
         * Field.Store.NO:不保存
         *
         * Field.Index.NO:不建立索引
         * Field.Index.TOKENIZED:分词,建索引
         * Field.Index.UN_TOKENIZED:不分词,建索引
         * Field.Index.NO_NORMS:不分词,建索引.但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储空间
         *
         * Field.TermVector.NO:不保存term vectors
         * Field.TermVector.YES:保存term vectors
         * Field.TermVector.WITH_POSITIONS:保存term vectors.(保存值和token位置信息)
         * Field.TermVector.WITH_OFFSETS:保存term vectors.(保存值和Token的offset)
         * Field.TermVector.WITH_POSITIONS_OFFSETS:保存term vectors.(保存值和token位置信息和Token的offset)
         */ 
 
分享到:
评论
1 楼 csdn_zuoqiang 2011-12-26  
Field.Store.YES:存储字段值(未分词前的字段值)
Field.Store.NO:不存储,存储与索引没有关系
Field.Store.COMPRESS:压缩存储,用于长文本或二进制,但性能受损

Field.Index.ANALYZED:分词建索引
Field.Index.ANALYZED_NO_NORMS:分词建索引,但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储空间
Field.Index.NOT_ANALYZED:不分词且索引
Field.Index.NOT_ANALYZED_NO_NORMS:不分词建索引,Field的值去一个byte保存

TermVector表示文档的条目(由一个Document和Field定位)和它们在当前文档中所出现的次数
Field.TermVector.YES:为每个文档(Document)存储该字段的TermVector
Field.TermVector.NO:不存储TermVector
Field.TermVector.WITH_POSITIONS:存储位置
Field.TermVector.WITH_OFFSETS:存储偏移量
Field.TermVector.WITH_POSITIONS_OFFSETS:存储位置和偏移量

相关推荐

Global site tag (gtag.js) - Google Analytics