「完璧な検索エンジン」は現われるのか、業界関係者が語る“検索の未来”

http://internet.watch.impress.co.jp/cda/event/2006/04/27/11823.html
 早稲田大学メディアネットワークセンターは26日、「インターネット検索の未来」と題して早稲田大学創立125周年記念公開シンポジウムを開催した。ヤフーやNTTレゾナントなどから業界有名人などが参加したパネルディスカッション「検索の未来を語る」をレポートする。
 パネリストは、ヤフーの井上俊一氏(検索事業部事業部長)、NTTレゾナントの国枝学氏(ポータル事業本部メディア事業部長)、ファストサーチ&トランスファの徳末哲一氏(代表取締役社長)、データセクションの橋本大也氏(代表取締役)、経済産業省の八尋俊英氏(商務情報政策局情報経済企画調査官)の5人。

検索エンジン、みんな使える?

 「みんなが使える検索エンジンですか」「検索の未来は如何に」――。モデレータを務めた早稲田大学の山名早人氏(理工学術院教授)が5人のパネリストに問うたのは、この2点だ。
 早稲田大学の「e-Societyプロジェクト」では2004年1月から2006年3月にかけて2,580万台のWebサーバーから約120億のWebページを収集してきた。英Netcraftの統計情報によれば全世界のサーバーは8,065万台。単純に比例計算すると、世界全体で375億の Webページが存在することになる。
 山名氏によると、2005年10月時点での各検索サイトによるインデックスサイズは、Googleが81億ページ、Yahoo!が42億ページ、MSNが50億ページだったという。全部合計しても173億ページ。半年前の情報であることを差し引いても、Webページ全体の半分以上は検索サイトにインデックスされていないことになる。
 こうした分析に山名氏は「網羅性はどうなのか」「インデックスすべきページを誰が選択しているのか」などの問題点を指摘。仮に膨大な数のサイトをインデックスしたとしても、今度はキーワード検索の検索結果には、確認するのが難しいほどおびただしい数のページが表示されることになる。「これではスキルの低い一般ユーザーが検索を使いこなすのは難しい」というのだ。
 とは言うものの、検索エンジン自体の利用方法には未来があるという。例えばGoogleYahoo!などの画像検索で「IMG_0001.jpg」と入力すると、キヤノンデジタルカメラ「IXY」のユーザーが初めて撮影した画像を検索できる。これは、撮影した画像ファイルを「IMG_[4桁の連番].jpg」と自動的に名前付けするIXYの機能を、検索キーワードとして利用したものだ。また、翻訳に検索エンジンを利用した場合、翻訳例のヒット数でより正しい翻訳を選択できるという。本来の利用方法とは異なるかもしれないが、こうした利用方法によって検索の用途が広がれば「明るい未来の兆しがある」というわけだ。

ソーシャルネットワークを検索に活用

 現状のWeb検索に限界があることは検索各社も承知している。「検索エンジンはキーワードの入力に依存しており、キーワードを入力できないユーザーは検索できない。究極のプルメディアだ」(ヤフー井上氏)、「入力されたクエリを理解し、適切な検索結果を抽出して、わかりやすく提示することが重要だ」(NTTレゾナント国枝氏)。
 Yahoo! JAPANやgooでは、こうした“Web検索の限界”に挑んでいる。「Yahoo!知恵袋」や「教えて!goo」などのコミュニティを利用した検索では、必ずしも適切なキーワードでなくても回答にたどり着くケースもある。また、gooでは独自のテキスト解析技術を用いて「評判検索」「Q&A検索」などの実験サービスも公開している。
 これら先進的なサービスのキーワードが、ヤフーの井上氏が提唱する「ソーシャルサーチ」だ。「昔はエディターがオーソリティを持っていたが、現在のオーソリティは個人のWebマスターに移りつつある。さらに今後は、ページを作る人よりも、検索を使ったりブログを閲覧するユーザーに移るのではないか。閲覧者の多いコミュニティは散在しており、それらコミュニティの情報をどうやって検索するのか。そのためにソーシャルネットワークを利用する。これがソーシャルサーチだ」。

● 開発競争は今後10年〜20年続く

 エンタープライズ向けに検索エンジンOEM提供するファストサーチ&トランスファの徳末氏はこう見る。「すべてがデータ化されているわけではないUnstructuredな状況で、情報が爆発している。企業やコミュニティにとって検索がミッションクリティカルな(ミスが許されない)システムになっている」。
 ファストサーチ&トランスファでは、楽天市場検索エンジンを提供している。徳末氏によれば、2,000万強の商品を対象にしているという。楽天市場の検索は入力されたキーワードに応じて絞り込み検索用キーワードを表示する。ファストサーチ&トランスファでは「ダイナミックドリルダウン検索」と呼んでおり、「ユーザーが思いつかなくても検索用キーワードを表示するため、2〜3クリックで目的のページまでアクセスできる」という。
 さらに「New Multimedia Solution」を紹介。これは、動画の背景が変わるたびにインデックスし、動画中の会話もテキスト化して動画データを検索できる可能にするソリューションだ。徳末氏は「(Unstructuredな状況を改善するような)本格的な検索エンジンは始まったばかり。開発競争は今後10年〜20年続く」と予想した。

● 10年〜20年後に「完璧な検索エンジン」は現われるのか

データセクションの橋本氏。インデックスサイズとアルゴリズムだけでなく、今後はインターフェイスやコミュニケーションが求められるという
 それでは10年後、もしくは20年後に「完璧な検索エンジン」は現われるのか。「例えば」と切り出すのはデータセクションの橋本氏だ。
 留学する彼女を認めつつ、母親にグダグダ愚痴をこぼす男性の気持ちを正確に把握する。これは「機械で実現できるだろうか」。橋本氏の回答を先に言ってしまうと、こういうシチュエーションでは何よりも母親からの「淋しいんだね、お前」という台詞が適切だという。
 テキストマイニングなどで男性の気持ちを要約するだけでは“本当の気持ち”に到達することは難しい。自然文検索が高度に進化すれば、あるいは検索結果に「淋しいんだね、お前」とヒットする可能性があるが、PCに「淋しいんだね」と慰められて満足する人がいるだろうか。
 橋本氏は「これまで検索は、インデックスサイズとアルゴリズムの時代だった」という。インデックスサイズを網羅性、アルゴリズムを技術と置き換えるとわかりやすいかもしれない。網羅性や技術が行き着くところまでいっても、利用するユーザーは所詮人間だからだ。
 今後はインデックスサイズとアルゴリズムに加えて、Ajaxのような新しい操作感覚によって自分自身で情報に気付くような「インターフェイス」と、他者から情報を引き出す対話のような「コミュニケーション」を掛け合わせることになるという。「これからは“現在の記憶を思い出すこと”や“未来を創造する対話”など、その時点までデータ化されていない情報が重要になる」と述べ、過去のデータを以て「世界をデータベース化する」ことはあまり意味がないのではないかと問題提起した。

● 来るべき“情報主義”時代は、情報の蓄積が大切

 フランスのシラク大統領は25日、検索エンジン「クエロ(Quaeroラテン語で“私は探し求める”の意味)」を開発することなどを発表した。2年間で先端的な技術開発に20億ユーロ(約2,800億円)を計上し、そのうちクエロの開発費に2億5,000万ユーロを投じるという。
 経済産業省で「ITによる『情報大航海時代』の情報利用を考える研究会」を担当する八尋氏は「情報大航海時代の火薬はCPU、活版印刷はOS。羅針盤にあたるのが検索技術などの知的情報アクセス手段だ」という。それまで先進国だった中国やインドなどが欧州の国々に敗れ去るターニングポイントになった大航海時代になぞらえ、それらを利用することが次世代の勝者の条件だと述べた。
 八尋氏は、CPUはインテル、OSはマイクロソフトが圧倒的シェアを握る今、羅針盤たる検索技術こそ日本が世界をリードするような技術を保有すべきだと主張。しかし、2005年秋には「日本は情報系の研究開発をあまりやっていないどころか、むしろ減らしていることがわかった」という。
 最後に、「資本主義は資本が蓄積された英国が発祥の地だ。今後の“情報主義”時代では、情報の蓄積が大切なのではないか。国がやれることは少ないが、国の重要目標に設定すれば、これまで情報系の研究開発予算が少なかった企業でも予算が増えるケースがあるという声も聞く。2015年ごろに間違った方向に進んでいると、インドなどに負けてしまう可能性もある」と危機感を示した。
■URL
  早稲田大学125周年記念公開シンポジウム
  http://www.waseda.jp/mnc/INSTITUTION/2006/sympo2006.html
  関連記事:欧州で立ち上がるQuaeroプロジェクトとは[Enterprise Watch]  http://enterprise.watch.impress.co.jp/cda/infostand/2006/01/23/7051.html
鷹木 創 )2006/04/27 14:38