lucene合并测试的总结

1 查询的总时间等于每个segment查询时间的总和
2 合并的步骤
    (1)做flush操作的先生成一个新的segment
    (2)检查在新segment之前已经存在的segment的数量是否大于maxmerge(默认是10个),大于了进行合并
    (3)合并完成又会生成一个新的segment,然后把前面10个segment删除。
 
每次追加46W条数据(46W一次提交) kfc数据,单field,单字分词,保存termvector,position,offset和payload信息,每次追加以后进行一次查询测试。
 
每次提交46W数据花费42-43S左右的时间,磁盘空间稳定上升36M,查询时间提高0.05秒,加入第12个segment的时候触发合并,合并前690MB,合并后425MB,12segment查询一次0.5S,查到3293508数据,12个segment生成到合并花费560S
总时间 42*11+560
 
egg同类测试(去事务,单字分词,压缩方式)
每批数据在22S左右,12次提交以后文件总大小1.3G,花费时间为244S,查询到 3293508花费 1.335018s
总时间 22*12

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。