2017.12.15 Friday
スポンサーサイト
一定期間更新がないため広告を表示しています
| スポンサードリンク | - | | - | - |
関口宏司のLuceneブログOSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
2010.07.26 Monday
デフォルトでPhraseQueryを生成しなくなったQueryParserに注意(3.1)
QueryParserは、クエリ文字列からQueryオブジェクトを生成するクラスだが、Analyzerが文字列を複数トークン返してくる際に、これまではPhraseQueryを生成していた。ところがLucene 3.1からはBooleanQueryのORに展開するように変更された:
https://issues.apache.org/jira/browse/LUCENE-2458 特にCJKAnalyzerなどのN-gram系Analyzerを使っている場合には単語(のつもり)が複数トークンを返すことが多いので、注意が必要である。以下にプログラムを示す: public static void main(String[] args) throws Exception { final Version V = Version.LUCENE_31; QueryParser parser = new QueryParser( V, "F", new CJKAnalyzer( V ) ); //System.out.println( "autoGeneratePhraseQueries = " + parser.getAutoGeneratePhraseQueries() ); //parser.setAutoGeneratePhraseQueries( true ); Query query = parser.parse( "こんにちは" ); System.out.println( "query.toString() = " + query.toString() ); System.out.println( "type of query = " + query.getClass().getSimpleName() ); } 実行結果は次のようになる: query.toString() = F:こん F:んに F:にち F:ちは type of query = BooleanQuery プログラムのバージョンをLUCENE_30(以前)にしたり、コメントアウト部分を有効にすると、実行結果は次の通りとなり、これまでのようにPhraseQueryが生成されるのがわかる: query.toString() = F:"こん んに にち ちは" type of query = PhraseQuery 2010.07.10 Saturday
第3回 Solr 勉強会 資料
資料をSlideshareにアップロードした:
Lu solr 20100709
View more presentations from KojiSekiguchi. 参加できなかった方へ、最後のページの「問題です」というのは何かというと、「この問題がわかればSolrトレーニングの基礎コースをとばして応用コースを受講しても大丈夫」という意味である。 Solrトレーニング 受講者募集中 |
+ Solrによるブログ内検索
+ PROFILE
+ LINKS
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
+ RECOMMEND
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
+ SPONSORED LINKS
|
(C) 2024 ブログ JUGEM Some Rights Reserved.
|
PAGE TOP |