関口宏司のLuceneブログ

OSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
<< Luceneアプリケーションの開発環境の紹介 | main | Namazu と Lucene >>
Luke - Luceneインデックスブラウザ
LukeはLuceneインデックスのブラウザである。次のような機能がある:

・Document番号または単語指定によるブラウズ
・Documentの表示とクリップボードへのコピー
・頻出語のランク付けされたリストの取得
・検索の実行と結果のブラウズ
・検索結果の分析
・Documentの削除
・ドキュメントフィールドの再構成と再挿入
・インデックスの最適化

Lukeを起動するには、LukeのサイトからLukeのJarファイル(執筆時はluke-0.6.jar)を入手し、Luceneアプリの実行時クラスパスにLukeのJarファイルを加えた状態で、次のように行う:



$ java org.getopt.luke.Luke



すでにLuceneのインデックスがある場合は、-indexオプションでインデックスのディレクトリを指定しながらLukeを起動できる:



$ java org.getopt.luke.Luke -index インデックスディレクトリパス



次はHelloLucene.javaで作成したインデックスをLukeで参照しているときの画面である:

Luke - Luceneインデックスブラウザ

ただし、HelloLucene.javaはRAMDirectoryを使っているので、ハードディスク上にインデックスを作るよう、FSDirectoryを使うように変更しなければならない。

次は同じLukeの画面だが、JapaneseAnalyzerではなく、CJKAnalyzerを使って作ったインデックスをブラウザしている様子である。単語がbi-gramで抽出されている様子がわかるだろう:

Luke - CJKAnalyzerで作成したインデックスのブラウズ
| 関口宏司 | Luceneツール | 09:38 | comments(0) | trackbacks(2) |









http://lucene.jugem.jp/trackback/69
[Lucene][全文検索]こういうツール必要だよねえ。
Luke - Luceneインデックスブラウザ http://lucene.jugem.jp/?eid=69 動作を解析したりするときに便利だにゃー。 Sennaいじめてくんを、 いじめるだけじゃなくて管理が出来るようにもしよう。
| グニャラくんのグニャグニャ備忘録@はてな | 2006/03/31 2:40 PM |
2009研究履歴
朴 光宇 2009年10月09日(金) 1.アイテムの「個人化クチコミ」利用する結果とGOOGLEで検索した結果の区別について 一つのアイテムの「型番」「特徴語」を検索する場合、GOOGLEとkakakuの結果が同じです。実はGOOGLEの第1の検索結果はkakakuです。 複数の場合「カメラ」
| PukiWiki/TrackBack 0.2 | 2010/04/20 5:00 PM |
+ Solrによるブログ内検索
+ PROFILE
 123456
78910111213
14151617181920
21222324252627
28293031   
<< May 2017 >>
+ LINKS
検索エンジン製品 - 比較のポイント
商用検索エンジンを購入した企業担当者は読まないでください。ショックを受けますから・・・
>>製品比較 10のポイント
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
Apache Solr入門 ―オープンソース全文検索エンジン
Apache Solr入門 ―オープンソース全文検索エンジン (JUGEMレビュー »)
関口 宏司,三部 靖夫,武田 光平,中野 猛,大谷 純
+ RECOMMEND
Lucene in Action
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless
FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
qrcode
+ SPONSORED LINKS