関口宏司のLuceneブログ

OSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
スポンサーサイト

一定期間更新がないため広告を表示しています

| スポンサードリンク | - | | - | - |
Lucene PMCメンバーに・・・
Lucene PMC(Luceneプロジェクト管理委員会)のメンバーになりました。
| 関口宏司 | Lucene/Solrコミュニティ | 11:03 | comments(2) | trackbacks(0) |
Lucene 2.9.4/3.0.3 リリース間近 〜 現在投票中
あれから1ヶ月も経ってしまったが、現在投票中である。Solr 1.4に関しては未定だが(Solrコミッターの関心外のよう)、以下のメールに「Lucene 2.9.4をSolr 1.4.1で使うためのパッチ」が添付されているので、必要な方は使ってみるといいだろう: http://mail-archives.apache.org/mod_mbox/lucene-general/201011.mbox/%3C007c01cb8f44$9f23e930$dd6bbb90$@thetaphi.de%3E
| 関口宏司 | Luceneリリース | 09:01 | comments(0) | trackbacks(0) |
プレゼン資料「オープンソース検索エンジンの今」@SCS
本日SCS様で行われたカンファレンスの私のプレゼン資料をSlideshareにアップロードしました。

オープンソース検索エンジンの今

http://www.slideshare.net/KojiSekiguchi/todaysosssearcheng
| 関口宏司 | Luceneセミナー | 23:25 | comments(0) | trackbacks(0) |
(メモ)LuceneはApache Harmony上で動作
LuceneはApache Harmony(Apacheで開発されているオープンソースのJava SE)上で動作する:

http://wiki.apache.org/harmony/Apache_Lucene
| 関口宏司 | Lucene自由自在 | 07:50 | comments(0) | trackbacks(0) |
Luceneのインデックスを使って共起分析
今発売中のWEB+DB PRESS Vol.59の「大規模データ分析」の記事は具体的で大変面白かった。その中第2章ではHadoopを使って大量の日本語テキストの処理を行い単語の共起分析を行う方法が書かれている。そこで私は早速「Solr本のサンプルデータ(技術評論社のWebサイトをクロールして集めた書籍データ)」を使ってやってみた。それだけでは芸がないので、Luceneのインデックスから共起分析を行い、それと比較してみる。Luceneのインデックスを使って共起分析をするには、以下で紹介されているプログラムを使った:

https://issues.apache.org/jira/browse/LUCENE-474

「データベース」と共起する上位の単語はそれぞれ次のようになった:

LUCENE-474Hadoop(χ二乗検定)
Access
プログラミング
リレーショナル
Oracle
XML
Excel
アプリケーション
エリ
テーブル
リレーショナル
フォーム
抽出
アプリケーション
蓄積


データ件数が少ない(千数百件程度)わりに、どちらもそれなりの出力がされていてなかなか面白い。
| 関口宏司 | Luceneツール | 01:23 | comments(0) | trackbacks(0) |
検索時シーケンス図
MLに流れていた、Mark Harwood氏による検索時のシーケンス図。

http://goo.gl/lE6a
| 関口宏司 | Luceneクラス解説 | 21:55 | comments(0) | trackbacks(0) |
+ Solrによるブログ内検索
+ PROFILE
 123456
78910111213
14151617181920
21222324252627
282930    
<< November 2010 >>
+ LINKS
検索エンジン製品 - 比較のポイント
商用検索エンジンを購入した企業担当者は読まないでください。ショックを受けますから・・・
>>製品比較 10のポイント
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
Apache Solr入門 ―オープンソース全文検索エンジン
Apache Solr入門 ―オープンソース全文検索エンジン (JUGEMレビュー »)
関口 宏司,三部 靖夫,武田 光平,中野 猛,大谷 純
+ RECOMMEND
Lucene in Action
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless
FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
qrcode
+ SPONSORED LINKS