関口宏司のLuceneブログ

OSS検索ライブラリのLuceneおよびそのサブプロジェクト(Solr/Tika/Mahoutなど)について
<< optimize( maxNumSegments ) | main | 会社ホームページに検索窓の設置 >>
スポンサーサイト

一定期間更新がないため広告を表示しています

| スポンサードリンク | - | | - | - |
Luceneブログ内検索デモのリニューアル
このブログページの右上にある「検索窓」の検索機能は、以前よりLuceneで作成したものを提供していたが、本日よりSolrに切り替えた。

この(Powered by RONDHUITと記してある)検索窓から検索すると、ブログサービスプロバイダ提供による検索機能ではなく、Solr(昨日まではLucene)を使って検索し、検索結果を表示するようになっている。

ブログサービスプロバイダ提供による検索機能はMovable Typeをはじめとして使いにくいものが多く、LuceneやSolrを使って専用の検索機能を設置することはユーザ(ブログ読者)の利便性を高めるのに役立つ。

ためしにこのページの右下にあるもうひとつの検索窓を使って適当な検索語(たとえば「Lucene」など)を検索してみて欲しい。この検索窓はブログサービスプロバイダ提供による検索機能であるが、そのレスポンスは検索語が含まれる記事がベタに出力されるだけのものであり、使いにくいことが実感できると思う。

デモシステムの概要

今回リニューアルしたブログ内検索デモのシステム構成を下図に示す。

デモシステム構成

「ブログ内検索」といいつつ、今回は私の会社のホームページも検索対象に含めている。つまり、ひとつの検索窓から検索すると検索結果ページには「ブログ記事」と「ロンウイットホームページ」のURLが混在して表示されるのだ。ブログと会社のホームページを「横断検索」できる、と言い換えてもよい。

・・・と書きながら今気がついたが、ブログと会社のホームページが横断検索できるのであれば、「検索窓」がブログの方にだけあるのは片手落ちではないか。会社のホームページの方にも横断検索のための検索窓があってしかるべきではないのか。まったくそのとおりなので、こちらは年明けにでもデザイナーさんにお願いしようと思う。
(なお、全文検索の会社のくせに会社のホームページに「検索窓」が設置していないことについて、前バージョンのデモを紹介しているこちらの記事にその理由が書かれている)

なお、今回のデモシステムではフロントAPサーバにはApache+FastCGI上でRailsのアプリケーション稼動させている。

デモシステムの新機能

今回のデモでは単にLuceneをSolrに置き換えたり、フロントにRailsを使用したりといった構成の変更だけではなく、次のような機能向上を取り入れている。

類義語検索

昨日のことであるが、私は近所のスターバックスに行き「本日のコーヒーのショートサイズ」を注文して店内で飲みながら「スタバではグランデを買え!」(吉本佳生著)を読んだ。

別に意識してそうしたわけではなく、私はスターバックスでは「本日のコーヒーのショートサイズ」を注文することと決まっているのだった。

コーヒー専門店であるスタバにはさまざまなコーヒーの種類やさらにはトッピングなるものが用意され、お客様の好みに合わせたコーヒーのバリエーションでおもてなしをしてくれるようになっている。私にはそれが恐ろしい。スタバには2000年ごろから親しんでいる私であるが、メニューからいろいろ選ぶことができないまま数年が過ぎ、今では「本日のコーヒーのショートサイズ」とレジ前でいうことが習慣として定着している。

突然何の話かと訝ると思うが、類義語の話の前フリである。上の文章では(実話である)「スターバックス」と「スタバ」を同じ意味で使っている。キーワード検索ではこれらを「類義語」として扱うようにできていないと、ユーザは検索窓に「スターバックス OR スタバ」などと入力しないと両方を検索できないため大変不便だ。今回のデモではこの類義語検索ができるようになっており、検索語のハイライトも可能である。

類義語の検索のためには類義語辞書を整備する必要があるが、デモでは現時点で次のような類義語リストを登録している:



ロンウイット, RONDHUIT, 丸八
アマゾン, amazon
アドビ, アドビシステムズ, adobe
イーモバイル, EMOBILE
リクルート, RECRUIT
レッドハット, redhat, red hat
マクドナルド, マック, マクド
スターバックス, スタバ, starbucks

コンサル, コンサルティング
コラボ, コラボレーション
コンファレンス, カンファレンス
ミーティング, 会議
ブログ, ウェブログ, weblog, blog
ウィンドウ, ウインドウ, window
エンタープライズ, enterprise
ミドルウェア, middleware
デモ, demo
ソースコード, プログラム
ページ, 頁

インデクシング, インデキシング, indexing
スループット, QPS
強調表示, ハイライト, highlight, highlighter
トランク, trunk
ドキュメント, 文書
サーチ, 検索
絞込み, 絞込, 絞り込み
エラー, error
なまず, ナマズ, 鯰, namazu
セナ, senna



たとえば、弊社名「ロンウイット」をアルファベットの「RONDHUIT」で検索したりその逆も可能である。「コンサルティング」で「コンサル」が検索できたりするので便利なのがわかるだろう。

絞り込み検索

これまでのデモシステムでも絞り込み検索は可能であるとしていたが、今まではブログのカテゴリや日付の範囲でどちらか一度絞り込み検索を行うと、その先さらに絞込みを行うことができなかった。

新しいデモでは、絞り込み検索のリンクをクリックして絞り込まれた結果を、さらに別のリンクをクリックして次々と絞り込んでいくことが可能となっている。

トップページのナビゲーションリンクの表示

トップページが次のようになった。

デモトップ画面
http://www.rondhuit-demo.com/lbs2demo/


こうやって客観的に見るとつくづく地味な画面だ(これも年明けデザイナーに頼んで何とかしよう)。それはともかく、図にあるようにトップページにはあらかじめ、検索窓に検索語を入力しなくても検索して絞り込んでいけるようにナビゲーションリンクが表示されるようになった。このリンクにはLucene学習者向けに、Luceneの基本クラスなるものを私があらかじめピックアップし、これらのクラスが含まれる記事が簡単に検索できるようにもなっている。なおこれらは検索語ではなくフィルタとして扱われるため、ハイライトの対象とはならないことを注記しておく。

また旧デモでは「最近検索されたことば」なるものがリンクで表示されていたが、検索キーワードのモニタリング機能は現在開発中のため、今回のデモからは一時的にはずしてある。
| 関口宏司 | Luceneデモ | 15:23 | comments(0) | trackbacks(1) |
スポンサーサイト
| スポンサードリンク | - | 15:23 | - | - |









トラックバック機能は終了しました。
【ウェブログ】についてのお得なブログリンク集
ウェブログ に関する最新のブログ検索の結果をまとめて、口コミや評判、ショッピング情報を集めてみると…
| 旬なキーワードでお得なブログのリンク集 | 2007/12/23 5:14 PM |
+ Solrによるブログ内検索
+ PROFILE
      1
2345678
9101112131415
16171819202122
23242526272829
3031     
<< August 2020 >>
+ LINKS
検索エンジン製品 - 比較のポイント
商用検索エンジンを購入した企業担当者は読まないでください。ショックを受けますから・・・
>>製品比較 10のポイント
+ Lucene&Solrデモ
+ ThinkIT記事
+ RECOMMEND
Apache Solr入門 ―オープンソース全文検索エンジン
Apache Solr入門 ―オープンソース全文検索エンジン (JUGEMレビュー »)
関口 宏司,三部 靖夫,武田 光平,中野 猛,大谷 純
+ RECOMMEND
Lucene in Action
Lucene in Action (JUGEMレビュー »)
Erik Hatcher,Otis Gospodnetic,Mike McCandless
FastVectorHighlighterについて解説記事を寄稿しました。
+ RECOMMEND
+ SELECTED ENTRIES
+ RECENT COMMENTS
+ RECENT TRACKBACK
+ CATEGORIES
+ ARCHIVES
+ MOBILE
qrcode
+ SPONSORED LINKS