码迷,mamicode.com
首页 > Web开发 > 详细

tantivy&lucene功能,写入性能对比

时间:2019-09-09 17:41:39      阅读:112      评论:0      收藏:0      [点我收藏+]

标签:anti   tcp   配置   values   mit   sync   log   table   idt   

硬件概述:cpu:24,内存:20g,磁盘:10*2.7T。

写入性能:(不对ip进行添加geo信息)。

写入性能对比

速度

Commit耗时(秒)

500*1000条

Bulk耗时(秒)

1000条dns

Bulk耗时(秒)

1000条tcpflow

Bulk耗时(秒)

1000条weblog

Cpu占用

磁盘使用

数据量tcpflow

线程配置

tantivy

155272

6-19

0.01-0.06

0.1-0.2

0.1-0.2

40-80 us, 5-15 sy

20-90

4_000_000条,870M

10*2+10*2*3

lucene

151633

3-4

0.2-0.3

1.3-1.4

1.3-1.4

60-80 us, 5sy

20-90

4_500_000条,1.3G

10*5

 

 

 

 

 

 

 

 

功能:

Query:查询功能。

Query

TermQuery
BooleanQuery
WildcardQuery
PhraseQuery
RangeQuery
FuzzyQuery
RegexpQuery
ConstantScoreQuery
PrefixQuery

tantivy

Y

Y

Y

Y

Y

Y

Y

Y

N

lucene

Y

Y

Y

Y

Y

Y

Y

Y

Y

 

Collector:用来在查询时获取doc的field信息,用来排序,过滤,聚合等。

Collector
TopCollector
TimeLimitingCollector
CountCollector
tantivy
Y
N
Y
lucene
Y
Y
N

 

Docvalues/fastfield:通过docvalues获取doc的field信息,用来排序,过滤,聚合等。

 

Docvalues/fastfield

tantivy
fastfield(目前仅支持数字)
lucene
Docvalues

 

IndexWriter: 写数据。

IndexWriter

Flush(不fsync,数据可能在buffer)

Commit(fsync到磁盘)

tantivy

N(目前未发现)

Y

lucene

Y

Y

 

总结:

功能

tantivy已实现了lucene的大多数功能。具体差异见上表。

 

写入性能

整体写入性能相近。

bulk索引数据时,tantivy速度快于lucene。

执行commit时,tantivy不如lucene,详见写入性能。

 

磁盘占用

磁盘占用相差不大,详见写入性能。

tantivy&lucene功能,写入性能对比

标签:anti   tcp   配置   values   mit   sync   log   table   idt   

原文地址:https://www.cnblogs.com/vsop/p/11493045.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!