2017.12.15 Friday
スポンサーサイト
一定期間更新がないため広告を表示しています
| スポンサードリンク | - | | - | - |
関口宏司のLuceneブログOSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
2010.04.30 Friday
NoMergePolicy & NoMergeScheduler (3.1)
なにも実行しないMergePolicy実装であるNoMergePolicyがLucene 3.1に追加された:
https://issues.apache.org/jira/browse/LUCENE-2331 これまでは自動マージを実行させたくない場合、mergeFactorを十分大きな値に設定する以外になかった。NoMergePolicyを使えばmergeFactorに大きな値を設定することなく、自動マージの実行を確実に抑止することができる。NoMergePolicyと同時にNoMergeSchedulerも追加された。これはNoMergePolicyを設定しておきながら、MergeSchedulerとして(デフォルトの)ConcurrentMergeSchedulerが使われるのはおかしいということで一緒に追加されたスケジュールされないMergeSchedulerの実装クラスである。 ところで、「自動マージを実行させたくない場合」とはどのような時だろう。それは、計画的にoptimizeを行っている運用ではそのような場面が考えられる。定期的にoptimizeが実行されていてある程度のインデックスのセグメント分割が織り込み済みの場合、自動マージはむしろ余計なディスクI/Oとみなされてしまう。 2010.04.25 Sunday
IndexWriterConfig (3.1)
IndexWriterクラスのさまざまな設定項目を1つにまとめるためのクラスIndexWriterConfigが3.1から追加された:
https://issues.apache.org/jira/browse/LUCENE-2294 使い方は、まず次のようなIndexWriterConfigのコンストラクタを使ってIndexWriterConfigのオブジェクトを作成する。 public IndexWriterConfig(Version matchVersion, Analyzer analyzer) { this.matchVersion = matchVersion; this.analyzer = analyzer; delPolicy = new KeepOnlyLastCommitDeletionPolicy(); commit = null; openMode = OpenMode.CREATE_OR_APPEND; maxFieldLength = UNLIMITED_FIELD_LENGTH; similarity = Similarity.getDefault(); termIndexInterval = DEFAULT_TERM_INDEX_INTERVAL; mergeScheduler = new ConcurrentMergeScheduler(); writeLockTimeout = WRITE_LOCK_TIMEOUT; maxBufferedDeleteTerms = DEFAULT_MAX_BUFFERED_DELETE_TERMS; ramBufferSizeMB = DEFAULT_RAM_BUFFER_SIZE_MB; maxBufferedDocs = DEFAULT_MAX_BUFFERED_DOCS; indexingChain = DocumentsWriter.defaultIndexingChain; mergedSegmentWarmer = null; codecProvider = DEFAULT_CODEC_PROVIDER; mergePolicy = new LogByteSizeMergePolicy(); maxThreadStates = DEFAULT_MAX_THREAD_STATES; readerPooling = DEFAULT_READER_POOLING; } するとコンストラクタの引数のVersionとAnalyzer以外のものはデフォルト値が設定されたIndexWriterConfigのオブジェクトconfができるので、そのconfに対して変更する必要がある設定値はconf.setXxx1(yyy1).setXxx2(yyy2)という具合にsetterメソッドを(必要なだけつなげて)呼び出して設定する。なお、Versionにはインデックスのフォーマットに合わせたLuceneのバージョンを指定する(特に既存のインデックスがなければ、最新のLUCENE_31を設定しておく)。 そうして用意したconfを別に作成したDirectoryオブジェクトと一緒にIndexWriterのコンストラクタに指定すると、IndexWriterConfigで設定した設定値のIndexWriterができる。IndexWriterのコンストラクタでは、引数に渡されたIndexWriterConfigはclone()されてそちらの方が保持されるため、IndexWriterを作成した後にIndexWriterConfigのオブジェクトの設定値を変更してもすでに作成したIndexWriterに影響を及ぼすことはない。 2010.04.14 Wednesday
(訂正記事)=>Erik Hatcher 氏、Yonik Seeley 氏来日!
先日の表題の記事、Erik HatcherではなくEric Griesさんでした。BASISさんとの打ち合わせで「ヨニックさんとエリックさんが来ます」とのことだったので、そのコンテキストでは誰だってErik Hatcherだと思いますよね。。。
2010.04.13 Tuesday
Lucene+SolrをEclipseで開いたときにエラーになるときの対処法
solr/src/test/org/apache/solr/core/TestConfig.javaがgetTextContent()でエラーになるときは、プロジェクトのBuild PathのLibrariesからlucene/contrib/ant/lib/Tidy.jarを削除する。Tidy.jarにはorg.w3c.dom.*のクラスが含まれており、これが悪さをしてしまう。
ネタ元: http://n3.nabble.com/Some-help-for-folks-trying-to-get-new-Solr-Lucene-up-in-Eclipse-td698753.html 2010.04.10 Saturday
Erik Hatcher 氏、Yonik Seeley 氏来日!
BASIS Technologyのプライベートカンファレンス「次世代サーチ・テクノロジー・フォーラム2010」が4月22日(木)に開催される。BASIS社員によると今回は「LuceneとSolrの技術とビジネスを全面に展開したフォーラムとなる!」とのことで、Lucene/SolrのコミッターであるErikさんとYonikさんも招聘するとのこと。このうちYonikさんは22日の分科会(参加費無料)で「開発者が語るSolr」とその前日のプレイベント「開発者直伝:Solr1.4トレーニング」(有料)で講演を行う。
このほか22日の分科会では元FAST Search社のChistian Moenによる「FAST ESPとSolrの比較」、BASIS Technologyによる「固有表現抽出製品REXの紹介」「Lucene入門」などのセミナーが開催される。 2010.04.08 Thursday
Solr trunk URLの移動の件(書籍「Apache Solr入門」訂正)
LuceneとSolrの開発環境がマージされたことに伴い、Lucene-javaとSolrのtrunkソースコードのURLが変更になった。
Solr本ではすべて安定リリース版Solr 1.4を使っているので関係ないと油断していたら、読者の方からP.158にFlare(SolrのRailsクライアントでtrunkにのみ存在する)について書いている部分があり古いtrunkのURLを参照しているところがあることを指摘していただいたのでここで訂正(というか、執筆当時は正しいURLであった)する: (誤)http://svn.apache.org/repos/asf/lucene/solr/trunk/client/ruby/flare (正)http://svn.apache.org/repos/asf/lucene/dev/trunk/solr/client/ruby/flare もう少し間違いが見つかったら、ちゃんと正誤表を書こう。。。 |
+ Solrによるブログ内検索
+ PROFILE
+ LINKS
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
+ RECOMMEND
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
+ SPONSORED LINKS
|
(C) 2024 ブログ JUGEM Some Rights Reserved.
|
PAGE TOP |