関口宏司のLuceneブログ

OSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
スポンサーサイト

一定期間更新がないため広告を表示しています

| スポンサードリンク | - | | - | - |
デフォルトでPhraseQueryを生成しなくなったQueryParserに注意(3.1)
QueryParserは、クエリ文字列からQueryオブジェクトを生成するクラスだが、Analyzerが文字列を複数トークン返してくる際に、これまではPhraseQueryを生成していた。ところがLucene 3.1からはBooleanQueryのORに展開するように変更された:

https://issues.apache.org/jira/browse/LUCENE-2458

特にCJKAnalyzerなどのN-gram系Analyzerを使っている場合には単語(のつもり)が複数トークンを返すことが多いので、注意が必要である。以下にプログラムを示す:

public static void main(String[] args) throws Exception {
  final Version V = Version.LUCENE_31;
  QueryParser parser = new QueryParser( V, "F", new CJKAnalyzer( V ) );
  //System.out.println( "autoGeneratePhraseQueries = " + parser.getAutoGeneratePhraseQueries() );
  //parser.setAutoGeneratePhraseQueries( true );
  Query query = parser.parse( "こんにちは" );
  System.out.println( "query.toString() = " + query.toString() );
  System.out.println( "type of query = " + query.getClass().getSimpleName() );
}


実行結果は次のようになる:

query.toString() = F:こん F:んに F:にち F:ちは
type of query = BooleanQuery


プログラムのバージョンをLUCENE_30(以前)にしたり、コメントアウト部分を有効にすると、実行結果は次の通りとなり、これまでのようにPhraseQueryが生成されるのがわかる:

query.toString() = F:"こん んに にち ちは"
type of query = PhraseQuery
| 関口宏司 | Luceneクラス解説 | 11:10 | comments(1) | trackbacks(1) |
Solr runs on Jailbroken iPad
http://imgur.com/tHRh3
| 関口宏司 | Solr | 08:09 | comments(0) | trackbacks(0) |
第3回 Solr 勉強会 資料
資料をSlideshareにアップロードした:



参加できなかった方へ、最後のページの「問題です」というのは何かというと、「この問題がわかればSolrトレーニングの基礎コースをとばして応用コースを受講しても大丈夫」という意味である。

Solrトレーニング 受講者募集中
| 関口宏司 | Luceneセミナー | 07:38 | comments(0) | trackbacks(0) |
+ Solrによるブログ内検索
+ PROFILE
    123
45678910
11121314151617
18192021222324
25262728293031
<< July 2010 >>
+ LINKS
検索エンジン製品 - 比較のポイント
商用検索エンジンを購入した企業担当者は読まないでください。ショックを受けますから・・・
>>製品比較 10のポイント
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
Apache Solr入門 ―オープンソース全文検索エンジン
Apache Solr入門 ―オープンソース全文検索エンジン (JUGEMレビュー »)
関口 宏司,三部 靖夫,武田 光平,中野 猛,大谷 純
+ RECOMMEND
Lucene in Action
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless
FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
qrcode
+ SPONSORED LINKS