関口宏司のLuceneブログ

OSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
スポンサーサイト

一定期間更新がないため広告を表示しています

| スポンサードリンク | - | | - | - |
Java 7u1 / Java 6u29 の不具合改修の件
先日お知らせしたJava 7の不具合が改修され、Lucene/Solrの動作確認が取れたため、アナウンスメールが流された。ロンウイットのホームページにも掲載したが、前回同様、こちらにも拙訳を掲載する。

Apache Lucene CoreおよびApache Solrユーザーの皆様こんにちは

オラクルは10月19日にJava 7u1 [1]をリリースしました。リリースノートおよびLuceneコミッターによるテスト結果から、7月28日に報告されたすべての不具合は本リリースにより改修されたことを確認しました。したがいまして、Porter StemmerはSIGSEGVによるクラッシュを発生させなくなりました。また、インデックス破壊も検出されませんので、Lucene CoreおよびSolrをJava 7u1上で安全に実行可能です。

同日、オラクルはJava 6u29[2]もリリースしました。Java 6において-XX:+AggressiveOptsまたは-XX:+OptimizeStringConcatのJVMスイッチを使用した際に同じ不具合起こしていたものですが、こちらも改修されました。もちろん、-XX:+AggressiveOptsのような"experimental"なJVMオプションを本番環境で使うべきではありませんけれども!私たちは、すべての人にこの最新バージョン6u29にアップグレードすることをお奨めいたします。

なお、Java 7にアップグレードする際は、インデックスを再作成するようにお願いします。Java 7でリリースされるユニコードのバージョンが変わるため、トークナイズの振る舞いが異なるためです(小文字など)。詳しくは各リリースパッケージのJRE_VERSION_MIGRATION.txtファイルを参照してください!

Apache Lucene/Solr コミッターを代表して、
Uwe Schindler




Solr 3.4なのにSolr 3.5の新機能までわかってしまう、最新情報満載のロンウイットのSolrトレーニング・・・Solr 3.4 11月 トレーニング受講者募集まもなく締め切り!

| 関口宏司 | 不具合関連 | 06:29 | comments(0) | trackbacks(0) |
言語判別機能の追加 (Solr 3.5)
次期Solrバージョン3.5には、言語判別機能が追加される予定である。言語判別機能は、インデックス作成時に呼び出され、あるフィールドが何語で書かれているかを自動判別する機能である。

https://issues.apache.org/jira/browse/SOLR-1979

これにより各ドキュメント/フィールド毎に最適なテキスト解析が行えるようになる。日本語以外のドキュメントを多く扱う企業、たとえばグローバルに事業展開を行っている企業の社内検索等に威力を発揮するだろう。

上記のSOLR-1979では言語判別機能としてApache Tikaの機能を使用している。これよりもサポートしている言語数と判別精度がよさそうな、サイボウズshuyoさん作の言語判別をとりこもうという提案がすでに追加でなされている。

language-detection
http://code.google.com/p/language-detection/

add alternative language detection impl
https://issues.apache.org/jira/browse/SOLR-2839

こちらもSolr 3.5におそらく入るのではないかと思われる。
| 関口宏司 | Solr | 12:26 | comments(1) | trackbacks(0) |
+ Solrによるブログ内検索
+ PROFILE
      1
2345678
9101112131415
16171819202122
23242526272829
3031     
<< October 2011 >>
+ LINKS
検索エンジン製品 - 比較のポイント
商用検索エンジンを購入した企業担当者は読まないでください。ショックを受けますから・・・
>>製品比較 10のポイント
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
Apache Solr入門 ―オープンソース全文検索エンジン
Apache Solr入門 ―オープンソース全文検索エンジン (JUGEMレビュー »)
関口 宏司,三部 靖夫,武田 光平,中野 猛,大谷 純
+ RECOMMEND
Lucene in Action
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless
FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
qrcode
+ SPONSORED LINKS