2017.12.15 Friday
スポンサーサイト
一定期間更新がないため広告を表示しています
| スポンサードリンク | - | | - | - |
関口宏司のLuceneブログOSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
2009.01.29 Thursday
QueryParserが全角スペースを判断(2.9)
Lucene 2.9でQueryParserが全角スペースをスペースとして判断するようになった:
https://issues.apache.org/jira/browse/LUCENE-1528 これまでは全角スペースがスペースとして判断されなかったため、検索窓に「検索△ランキング」(△は全角スペース)と入力してそれをそのままQueryParserに渡すと、QueryParserはこれを1単語として判断してAnalyzerに渡してしまう。その後どうなるかは使用するAnalyzerにより異なるが、たとえばWhitespaceAnalyzerであれば(これはCharacter.isWhitespace()で判断しているので)全角スペースでトークンの切れ目と判断し、結果的に"検索 ランキング"というフレーズ検索になってしまっていた。 Lucene 2.9からは「検索△ランキング」の全角スペースはQueryParserが判断する単語の切れ目になるので、「検索」と「ランキング」のTermQueryをANDまたはOR(どちらになるかはQueryParserの設定で決定する)で接続したBooleanQueryが生成されるようになる。 日本ではIMEなどの設定により、漢字入力中のスペース入力が人によって全角スペースであったり半角スペースであったり統一されていないため、「検索△ランキング」の全角スペースをQueryParserに渡す前に半角スペースに変換する必要があったが、このステップが今後は省略できるようになる。 2009.01.07 Wednesday
(メモ)Fast Similarity Search関連の資料
- Fast Similarity Search in Large Dictionaries. http://fastss.csg.uzh.ch/
- Paper: Fast Similarity Search in Large Dictionaries. http://fastss.csg.uzh.ch/ifi-2007.02.pdf - FastSimilarSearch.java http://fastss.csg.uzh.ch/FastSimilarSearch.java - Paper: Fast Similarity Search in Peer-to-Peer Networks. http://www.globis.ethz.ch/script/publication/download?docid=506 https://issues.apache.org/jira/browse/LUCENE-1513 P.S. 新年あけましておめでとうございます。本年もどうぞよろしくお願いいたします。 |
+ Solrによるブログ内検索
+ PROFILE
+ LINKS
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
+ RECOMMEND
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
+ SPONSORED LINKS
|
(C) 2024 ブログ JUGEM Some Rights Reserved.
|
PAGE TOP |