三が日を使って3つのサイトを紹介してきましたが、いかがだったでしょうか。
第1回 自然言語検索エンジン Hakia
第2回 人力検索ナビゲーション ChaCha
第3回 視覚中心検索エンジン Snap
検索エンジン市場はGoogleの成功以来多くのベンチャー企業が名乗りを上げ、National Venture Capital Associationによると2004年初頭から今日まで、80前後の企業に3億5千万ドル近い投資が行われているということです。しかし、その殆どが成功とは程遠いところで苦戦を強いられ、或いは挫折を余儀なくされています。
彼らの多くはGoogleのカヴァーしていない部分(画像、ビデオ、Blog、医療情報などの検索)に特化した検索を行ったり、幾つかのサービスをかき集めて「マッシュアップ」として相乗効果を狙うようなものでした。そして結果として、前者のうち有望なものは「全ての情報を有機的に繋ぐ」というGoogleの戦略の下に買収され、後者は類似サービスの林立に埋もれて行ったりしました。
現在、投資家の眼はこういった「隙間を狙う」企業ではなく、Googleより良い検索結果を提供することにより「正面から戦いを挑む」企業に向いているようです。
今回紹介したサイトはそれぞれ、シリコンバレーのベンチャー投資家から注目を集めている企業でもあります。
Hakia、Snapはそれぞれ1千600万ドルを集め、ChaChaは610万ドルに加えAmazonのチーフエグゼクティブであるJeffrey P. Bezos氏が肩入れしています。
投資家の眼が必ずしも正しいわけでは決してありませんが、エンドユーザが2006年に停滞感を抱き始めていたことは事実でしょう。
「Googleの牙城を脅かす」可能性を秘めた、新しい検索体験をもたらしてくれるサイトの出現を渇望する声は、今後更に大きくなっていくのではないかと思います。
2007年にそういったムーブメントが加熱していく期待を込めて、最後にあと2つの未だベータ版すらlaunchされていないサイトを簡単に紹介して今回の特集は終わりたいと思います。
Search Wikia
昨年大ブレイクしたWikipediaの創始者が設立したWikia Inc.によるプロジェクトで、Wikipedia同様にエンドユーザとプログラマーによるコミュニティが共同で創り上げる検索エンジン...を標榜しているが、その実体はまだ見えてきていません。
人間が検索結果をオプティマイズしていくところはChaChaに近い発想ですが、雇われた検索ガイドによる結果の提示ではなく、あくまで一般エンドユーザにより積み上げていくところはWikipedia同様のこだわりを感じます。しかしウェブサイトのように更新頻度の高いものを、クローラーを超える精度で更新していけるのかという点には、やはりChaChaと同様の疑問を感じます。
昨年末よりサイトマスターであるJimbo Wales氏より「Googleは良い検索エンジンだが、多くのケースにおいてはスパムやゴミのような結果しか返さない」「機械による判定は不可解で醜悪であり、人間の手による信頼感には決して及ばない」「現在の検索エンジンは既に崩壊状態にある」などと過激なプロパガンダが展開されており、何がしかのサービスインが近いのかもしれません。
# もしくは資金繰りに煮詰まりつつあるのか
Amazonが出資していることでも知られますが、公式サイトにてサービスとしての繋がりはきっぱり否定。
あくまで資金供出の関係だけであり、A9プロジェクトとも関わりが無いことを強調しています。
今のところ実際のユーザよりも投資家の期待が過多な気がしますが、今後の展開が注目されるサイトであることは確かです。
Powerset
ある意味、今回のタイトルに最もふさわしい大本命かもしれません。
方向性としてはHakiaと同様の「自然言語検索」。
ほとんどが未だに公開されていませんが、2006年10月にTechCrunchが伝えたところによると、デモに参加した多くの人が「もうGoogleには戻れない」と賛嘆しているとか。
同記事によれば彼らの目指すところは次のようなものだそうです。
例えば「book for children(子供向けの本)」「book by children(子供によって書かれた本)」「book about children(子供について書かれた本)」は全て意味が異なるのに、Googleはこの文脈から「for」「by」「about」などをstop wordと呼び除外してしまう。そのため、これら全ては「book」「children」という2つの単語として検索され、欲しい結果を得ることは至難の業になる。望ましい結果を得るためには、このstop wordを含めた「book by children」として意味を理解してやる、自然言語検索しかない。
この例を見ると、Googleであっても「"book by children"」とフレーズで検索すればある程度望ましい結果が得られるのでは?と感じてもしまいます。しかしそれは当然サイトがこのフレーズを完全に含んでいた場合のみにマッチするので、少し違った表現で書かれていれば一致しないでしょう。
こうして見てみると、自然言語検索の肝はクエリーの解析以上にインデックス作成時にかかっているのかもしれません。
TechCrunchの記事によれば彼らはデモ公開により1千万ドルの調達を目指していたようですが、NYTimesの記事では既に1千250万ドルを集めているようです。
日本語のサイトがこの恩恵を受ける日はなかなか来ないかもしれませんが、アルファ公開時には大きな反響が世界に伝えられそうです。


コメント