関口宏司のLuceneブログ

OSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
スポンサーサイト

一定期間更新がないため広告を表示しています

| スポンサードリンク | - | | - | - |
日本語フィールド名での不具合(2.4)
Lucene 2.3で作成したインデックスをLucene 2.4にアップグレード(Luceneライブラリを2.3から2.4にアップグレードし、2.3で作成したインデックスを2.4で更新すればインデックスは2.4フォーマットに自動的に変換される)したときに、もしフィールド名に日本語などnon-ASCIIキャラクタを用いていると、"read past EOF"例外に出会う可能性がある不具合が報告されている。例外にならなくても正しいフィールド名が返らない可能性がある。

この不具合はLucene 2.9で修正される予定である:

https://issues.apache.org/jira/browse/LUCENE-1623

| 関口宏司 | 不具合関連 | 09:20 | comments(0) | trackbacks(0) |
NIOFSDirectoryでパフォーマンスアップ!(Linux)
Lucene 2.4から導入されたNIOFSDirectoryはぜひLinuxプラットフォームでは積極的に使うことを考慮すべきである。一般的にパフォーマンスが良くなる。

ただWindowsでは逆に遅くなってしまい、現在のところWindowsではFSDirectoryを使った方が良い。これはSunのJavaのバグが原因とのことらしい:

http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6265734

| 関口宏司 | Luceneパフォーマンス | 00:30 | comments(0) | trackbacks(0) |
(メモ)中国語の形態素解析器
http://code.google.com/p/imdict-chinese-analyzer/
| 関口宏司 | Luceneツール | 23:14 | comments(5) | trackbacks(0) |
「Railsアプリケーション開発者のためのSolr入門」 - 無料セミナーの資料公開
昨年実施した「Railsアプリケーション開発者のためのSolr入門」のセミナー資料を会社のダウンロードサイトで公開した。

Railsアプリケーション開発者のためのSolr入門
http://www.rondhuit.com/download/solr1.2-seminar-rel1.0.pdf



| 関口宏司 | solr-ruby | 09:42 | comments(3) | trackbacks(0) |
(メモ)SUN Javaバグページ
Luceneアプリが踏む可能性のあるSUN製Javaのバグ一覧ページ

http://wiki.apache.org/lucene-java/SunJavaBugs
| 関口宏司 | その他(分類不能) | 00:43 | comments(0) | trackbacks(0) |
+ Solrによるブログ内検索
+ PROFILE
   1234
567891011
12131415161718
19202122232425
2627282930  
<< April 2009 >>
+ LINKS
検索エンジン製品 - 比較のポイント
商用検索エンジンを購入した企業担当者は読まないでください。ショックを受けますから・・・
>>製品比較 10のポイント
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
Apache Solr入門 ―オープンソース全文検索エンジン
Apache Solr入門 ―オープンソース全文検索エンジン (JUGEMレビュー »)
関口 宏司,三部 靖夫,武田 光平,中野 猛,大谷 純
+ RECOMMEND
Lucene in Action
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless
FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
qrcode
+ SPONSORED LINKS