2006.03.31 Friday
Luke - Luceneインデックスブラウザ
LukeはLuceneインデックスのブラウザである。次のような機能がある:
・Document番号または単語指定によるブラウズ
・Documentの表示とクリップボードへのコピー
・頻出語のランク付けされたリストの取得
・検索の実行と結果のブラウズ
・検索結果の分析
・Documentの削除
・ドキュメントフィールドの再構成と再挿入
・インデックスの最適化
Lukeを起動するには、LukeのサイトからLukeのJarファイル(執筆時はluke-0.6.jar)を入手し、Luceneアプリの実行時クラスパスにLukeのJarファイルを加えた状態で、次のように行う:
すでにLuceneのインデックスがある場合は、-indexオプションでインデックスのディレクトリを指定しながらLukeを起動できる:
次はHelloLucene.javaで作成したインデックスをLukeで参照しているときの画面である:

ただし、HelloLucene.javaはRAMDirectoryを使っているので、ハードディスク上にインデックスを作るよう、FSDirectoryを使うように変更しなければならない。
次は同じLukeの画面だが、JapaneseAnalyzerではなく、CJKAnalyzerを使って作ったインデックスをブラウザしている様子である。単語がbi-gramで抽出されている様子がわかるだろう:

・Document番号または単語指定によるブラウズ
・Documentの表示とクリップボードへのコピー
・頻出語のランク付けされたリストの取得
・検索の実行と結果のブラウズ
・検索結果の分析
・Documentの削除
・ドキュメントフィールドの再構成と再挿入
・インデックスの最適化
Lukeを起動するには、LukeのサイトからLukeのJarファイル(執筆時はluke-0.6.jar)を入手し、Luceneアプリの実行時クラスパスにLukeのJarファイルを加えた状態で、次のように行う:
$ java org.getopt.luke.Luke
すでにLuceneのインデックスがある場合は、-indexオプションでインデックスのディレクトリを指定しながらLukeを起動できる:
$ java org.getopt.luke.Luke -index インデックスディレクトリパス
次はHelloLucene.javaで作成したインデックスをLukeで参照しているときの画面である:
ただし、HelloLucene.javaはRAMDirectoryを使っているので、ハードディスク上にインデックスを作るよう、FSDirectoryを使うように変更しなければならない。
次は同じLukeの画面だが、JapaneseAnalyzerではなく、CJKAnalyzerを使って作ったインデックスをブラウザしている様子である。単語がbi-gramで抽出されている様子がわかるだろう:


