2017.12.15 Friday
スポンサーサイト
一定期間更新がないため広告を表示しています
| スポンサードリンク | - | | - | - |
関口宏司のLuceneブログOSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
2010.11.29 Monday
Lucene 2.9.4/3.0.3 リリース間近 〜 現在投票中
あれから1ヶ月も経ってしまったが、現在投票中である。Solr 1.4に関しては未定だが(Solrコミッターの関心外のよう)、以下のメールに「Lucene 2.9.4をSolr 1.4.1で使うためのパッチ」が添付されているので、必要な方は使ってみるといいだろう:
http://mail-archives.apache.org/mod_mbox/lucene-general/201011.mbox/%3C007c01cb8f44$9f23e930$dd6bbb90$@thetaphi.de%3E
2010.11.17 Wednesday
プレゼン資料「オープンソース検索エンジンの今」@SCS
本日SCS様で行われたカンファレンスの私のプレゼン資料をSlideshareにアップロードしました。
オープンソース検索エンジンの今 http://www.slideshare.net/KojiSekiguchi/todaysosssearcheng 2010.11.10 Wednesday
(メモ)LuceneはApache Harmony上で動作
LuceneはApache Harmony(Apacheで開発されているオープンソースのJava SE)上で動作する:
http://wiki.apache.org/harmony/Apache_Lucene 2010.11.06 Saturday
Luceneのインデックスを使って共起分析
今発売中のWEB+DB PRESS Vol.59の「大規模データ分析」の記事は具体的で大変面白かった。その中第2章ではHadoopを使って大量の日本語テキストの処理を行い単語の共起分析を行う方法が書かれている。そこで私は早速「Solr本のサンプルデータ(技術評論社のWebサイトをクロールして集めた書籍データ)」を使ってやってみた。それだけでは芸がないので、Luceneのインデックスから共起分析を行い、それと比較してみる。Luceneのインデックスを使って共起分析をするには、以下で紹介されているプログラムを使った:
https://issues.apache.org/jira/browse/LUCENE-474 「データベース」と共起する上位の単語はそれぞれ次のようになった:
データ件数が少ない(千数百件程度)わりに、どちらもそれなりの出力がされていてなかなか面白い。 |
+ Solrによるブログ内検索
+ PROFILE
+ LINKS
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
+ RECOMMEND
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
+ SPONSORED LINKS
|
(C) 2024 ブログ JUGEM Some Rights Reserved.
|
PAGE TOP |