関口宏司のLuceneブログ

OSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
<< ComplexPhraseQueryParser (2.9) | main | (メモ)YouSeer >>
autocommitの設定値でインデクシング時間に大きな差
contrib/benchmarkを使って2.4と2.9のインデックス作成時間を比較していたMark Miller氏は、2.9で大幅な速度向上を発見。2.9は3分少々の処理時間のところ、2.4は20分以上もかかっている。原因を追及していくと、Lucene 2.4と2.9のautocommitのデフォルト設定値の違いであることが判明した。

2.9はautocommit=falseがデフォルトであり、2.4はtrueである。2.4でもfalseにすると、2.9と近いプロファイルを示し、処理時間も4分程度に縮まった:

http://www.nabble.com/benchmark%3A-lucene24-vs-lucene29-td24835195.html
| 関口宏司 | Luceneパフォーマンス | 08:38 | comments(0) | trackbacks(0) |









http://lucene.jugem.jp/trackback/333
+ Solrによるブログ内検索
+ PROFILE
  12345
6789101112
13141516171819
20212223242526
2728293031  
<< January 2019 >>
+ LINKS
検索エンジン製品 - 比較のポイント
商用検索エンジンを購入した企業担当者は読まないでください。ショックを受けますから・・・
>>製品比較 10のポイント
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
Apache Solr入門 ―オープンソース全文検索エンジン
Apache Solr入門 ―オープンソース全文検索エンジン (JUGEMレビュー »)
関口 宏司,三部 靖夫,武田 光平,中野 猛,大谷 純
+ RECOMMEND
Lucene in Action
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless
FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
qrcode
+ SPONSORED LINKS