現在までに、さまざまな企業・団体が商用・OSS(オープンソース)のものを合わせて、多数の検索エンジンを開発しています。以下に、よく知られているものを集めました。
それでは、検索エンジンを代表してSolrを実際に使用してみます。
SolrはJVM環境で動作するため、Java実行環境をインストールする必要があります。初めに、JDK 1.5以上をダウンロードしてインストールした後、環境変数「JAVA_HOME」を設定しておいてください。
Solrの最新バージョン(原稿執筆時では3.4)をダウンロードページからダウンロードしてください。
Solrのインストールは非常に簡単です。では実際に利用してみましょう。初めに以下のコマンドでダウンロードしてきた「apache-solr-***.tar.gz」ファイルを解凍し、Solrの起動ディレクトリまで移動します。
$ tar zxvf apache-solr-3.4.0.tgz $ cd apache-solr-3.4.0/example
起動ディレクトリで、以下のコマンドを実行すると、Solrが立ち上がります。
$ java -jar start.jar &
この後、以下のようなログがターミナルに出ます。
2011-10-11 11:40:33.170:INFO::Logging to STDERR via org.mortbay.log.StdErrLog 2011-10-11 11:40:33.327:INFO::jetty-6.1-SNAPSHOT 2011-10-11 11:40:33.413:INFO::Extract file:apache-solr-3.4.0/example/webapps/solr.war to tmp/apache-solr-3.4.0/example/work/Jetty_0_0_0_0_8983_solr.war__solr__k1kf17/webapp 2011/10/11 11:40:34 org.apache.solr.core.SolrResourceLoader locateSolrHome ……
Solrがうまく起動できているのかをチェックために、Webブラウザを起動します。WebブラウザでURL「http://localhost:8983/solr/admin」と入力すると、以下のようなSolrのアドミニストレータ用ページが開きます。
アドミニストレータ用UI内の[Query String]と記述のあるフォームにクエリを入力して[Search]ボタンを押すと、インデックスを検索できます。デフォルトの検索クエリ(検索クエリを入力するフォームに初めに表示)は「*:*」でインデックスされているすべての文書を取得します。残念ながら、まだ何もインデックスしていないため、図3のように検索結果は0件(numFound=0)となります。
起動しているSolrに文書をインデックスしてみましょう。インデックスするサンプルデータと必要なプログラムは「exampledocs」ディレクトリにあります。以下のコマンドを実行してください。
$ java -jar exampledocs/post.jar exampledocs/*.xml
これでインデックスに文書を追加できました。うまくインデックスを検索できるかアドミニストレータUIで見てみましょう。アドミニストレータUIで[Search]ボタンを押すとインデックスされたすべての文書を検索します。図4のような検索結果が出ると、インデックスは無事生成できています。
次ページでは最後に、Solrを使いこなすために今後学ぶべきことを紹介します。
Copyright © ITmedia, Inc. All Rights Reserved.