码迷,mamicode.com
首页 > Web开发 > 详细

Lucene 基础类型

时间:2017-09-13 19:27:27      阅读:170      评论:0      收藏:0      [点我收藏+]

标签:个数   没有   bit   str   UI   alt   位置   整数   images   

Lucene 索引文件中,用一下基本类型来保存信息:
1. Byte:是最基本的类型,长 8 位(bit)。
2. UInt32:由 4 个 Byte 组成。
3. UInt64:由 8 个 Byte 组成。
4. VInt:
" 变长的整数类型,它可能包 多个 Byte,对于每个 Byte 的 8 位,其中后 7 位表示数值,最高 1 位表示是否还有另一个 Byte,0 表示没有,1 表示有。
" 越前面的 Byte 表示数值的低位,越后面的 Byte 表示数值的高位。
" 例如 130 化为二进制为 1000, 0010,总共需要 8 位,一个 Byte 表示不了,因而需要两个 Byte 来表示,第一个 Byte 表示后 7 位,并且在最高位置 1 来表示后面还有 一个Byte,所以为(1) 0000010,第二个Byte表示第8位,并且最高位置0来表示 后面没有其他的 Byte 了,所以为(0) 0000001。

技术分享

 5.Chars:是 UTF-8 编码的一系列 Byte。

 6.String:一个字符串首先是一个 VInt 来表示此字符串包 的字符的个数,接着便是 UTF-8编码的字符序列 Chars。

Lucene 基础类型

标签:个数   没有   bit   str   UI   alt   位置   整数   images   

原文地址:http://www.cnblogs.com/wangmh/p/7516342.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!