2017.12.15 Friday
スポンサーサイト
一定期間更新がないため広告を表示しています
| スポンサードリンク | - | | - | - |
関口宏司のLuceneブログOSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
2011.10.27 Thursday
Java 7u1 / Java 6u29 の不具合改修の件
先日お知らせしたJava 7の不具合が改修され、Lucene/Solrの動作確認が取れたため、アナウンスメールが流された。ロンウイットのホームページにも掲載したが、前回同様、こちらにも拙訳を掲載する。
Apache Lucene CoreおよびApache Solrユーザーの皆様こんにちは オラクルは10月19日にJava 7u1 [1]をリリースしました。リリースノートおよびLuceneコミッターによるテスト結果から、7月28日に報告されたすべての不具合は本リリースにより改修されたことを確認しました。したがいまして、Porter StemmerはSIGSEGVによるクラッシュを発生させなくなりました。また、インデックス破壊も検出されませんので、Lucene CoreおよびSolrをJava 7u1上で安全に実行可能です。 同日、オラクルはJava 6u29[2]もリリースしました。Java 6において-XX:+AggressiveOptsまたは-XX:+OptimizeStringConcatのJVMスイッチを使用した際に同じ不具合起こしていたものですが、こちらも改修されました。もちろん、-XX:+AggressiveOptsのような"experimental"なJVMオプションを本番環境で使うべきではありませんけれども!私たちは、すべての人にこの最新バージョン6u29にアップグレードすることをお奨めいたします。 なお、Java 7にアップグレードする際は、インデックスを再作成するようにお願いします。Java 7でリリースされるユニコードのバージョンが変わるため、トークナイズの振る舞いが異なるためです(小文字など)。詳しくは各リリースパッケージのJRE_VERSION_MIGRATION.txtファイルを参照してください! Apache Lucene/Solr コミッターを代表して、 Uwe Schindler
Solr 3.4なのにSolr 3.5の新機能までわかってしまう、最新情報満載のロンウイットのSolrトレーニング・・・Solr 3.4 11月 トレーニング受講者募集まもなく締め切り! 2011.10.16 Sunday
言語判別機能の追加 (Solr 3.5)
次期Solrバージョン3.5には、言語判別機能が追加される予定である。言語判別機能は、インデックス作成時に呼び出され、あるフィールドが何語で書かれているかを自動判別する機能である。
https://issues.apache.org/jira/browse/SOLR-1979 これにより各ドキュメント/フィールド毎に最適なテキスト解析が行えるようになる。日本語以外のドキュメントを多く扱う企業、たとえばグローバルに事業展開を行っている企業の社内検索等に威力を発揮するだろう。 上記のSOLR-1979では言語判別機能としてApache Tikaの機能を使用している。これよりもサポートしている言語数と判別精度がよさそうな、サイボウズshuyoさん作の言語判別をとりこもうという提案がすでに追加でなされている。 language-detection http://code.google.com/p/language-detection/ add alternative language detection impl https://issues.apache.org/jira/browse/SOLR-2839 こちらもSolr 3.5におそらく入るのではないかと思われる。 |
+ Solrによるブログ内検索
+ PROFILE
+ LINKS
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
+ RECOMMEND
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
+ SPONSORED LINKS
|
(C) 2024 ブログ JUGEM Some Rights Reserved.
|
PAGE TOP |