Googleの“ナレッジグラフ”を徹底解剖

昨日、Googleがテスト中のブレンド検索について紹介しましたが今週、それも含めたGoogle検索が大幅にバージョンアップすることとなりました。早速サーチエンジンランドからその詳細解説を。 — SEO Japan

本日、数ヶ月前から示唆していた、“ナレッジグラフ”を、グーグルはついに公式にローンチした。この新しいテクノロジーは、人物、場所、そして、物事に関するポピュラーな事実をグーグルの通常の検索結果と共に提供するために用いられている。また、ナレッジグラフは、クエリの用語にマッチするページではなく、クエリが描写する“エンティティ”またはコンセプトを検索する新たな方法をグーグルにもたらす。

ナレッジグラフとは何だろうか?“グラフ”は、一連のエンティティがつながる仕組みを説明するために使われる用語である。グーグルは“リンクグラフ”を用いて、ページがお互いにリンクを張っている仕組みをモデル化し、検索に対して、どのページの人気が高いのか、どのページが関連しているのかを判断している。フェイスブックは“ソーシャルグラフ”を利用し、ユーザーがどのようにつながっているのかを把握している。“ナレッジグラフ”は、異なる人々、場所、そして、物事の間の関係を構築する仕組みに対するグーグルの用語であり、このようなエンティティに関する事実を報告する役目を持つ。

大きな変更だが見た目はあまり変わらず

今年3月、ウォールストリートジャーナルは、今後の変更に関する記事を投稿していた。当時、私はこの記事で取り上げられている変更は、大幅な変更と言うよりも、これまでグーグルが行ってきた取り組みの延長だと感じた。ウォールストリートジャーナルは正しかった。これは、1月にローンチされたサーチ・プラス・ユア・ワールド(日本語)、そして、2007年のユニバーサル検索等のその他の主要なローンチに匹敵する大きな変更である。

大きな変更ではあるが、米国英語を用いてGoogle.comで検索している大半のユーザーの目にとっては、大した変更には映らないだろう。

グーグルの見た目は基本的に現在と変わらない。ナレッジグラフの情報は、新しいユニット – 公式名がないので(もちろんグーグルに尋ねてみた)、“ナレッジパネル”と呼ぶ – に流れ込む。ナレッジパネルは、お馴染みのリンクを邪魔するのではなく、通常の結果の右側に現れる:

ナレッジパネルは、グーグルが関連していると判断した場合のみ表示される。グーグルが関連していると判断すると、優れた検索調査ツールとしてナレッジパネルが現れる。グーグル検索のトップ、アミット・シンガル氏が、昨日行われたSMX ロンドンキーノートトーク(日本語)の後にこの新しいシステムを試す機会を与えてくれた時、検索版のスタンブルアポンやチャンネルサーフィングのようなツールだと私は感じた。

ファクトサーフィン

Star Trek(スタートレック)で検索を行うと、私の好きなシリーズのStar Trek: Voyagerに言及したパネルが表示された。このパネルをチェックすると、Voyagerのボックスは、別のお気に入りのScifi番組のBabylon 5に言及していた。このパネルに注目すると、Babylon 5のメインキャラクターの一人、スーザン・イバノバを見事に演じていたクラウディア・クリスチャンを参照していた。気づくと私は夢中になってサーフしていた。

ウィキペディアのページを読み始め、知らぬ間にトピックからトピックを渡り歩いていたことはあるだろうか?大勢のユーザーがこのような経験をグーグルでするようになるだろう。事実に関する質問への答えを見つけるだけでなく、すぐに予定を超えた調査を行い、しかも、楽しみながらファクトサーフィンをするようになるのではないだろうか。

約5億点のエンティティに関する35億の事実

グーグルは、35億点の事実を編集している。その中には、5億点の対象物(グーグルは時折“エンティティ”と呼んでいる)に関する情報、そして、関係が含まれている。一般的にエンティティは人物、場所、そして、物事を指す。つまり、名詞である。

グーグルが事実を提供するエンティティのカテゴリーを以下に挙げていく:

  • 俳優、監督、映画
  • 芸術作品 & 博物館
  • 市 & 国
  • 島、湖、灯台
  • 楽曲アルバム & 音楽のバンド
  • 惑星 & 宇宙船
  • ジェットコースター & 高層ビル
  • スポーツチーム

繰り返すが、これはあくまでもカテゴリーの一部である。また、関係も事実と同じように重要である。関係により、ナレッジグラフは、どの俳優をどの映画に表示すればいいのか、またはどの宇宙船がどの惑星に訪れたのかを把握することが出来るのだ。

最も人気の高い事実

それではグーグルはユーザーが役に立たない事実に惑わされないようにどのような対策を講じているのだろうか?グーグルは、エンティティに対して、当該のエンティティに関連して最も検索された回数が多い事実を選び出すようだ。

「グーグルは所定のクエリに対してユーザーが探している全ての情報を提供している。」とシンガル氏は述べていた。

次の2つのパネル(一つはシンプソンズのクリエターであるマット・グレイニング氏のパネル、そして、もう一つは建築家のフランク・ロイド・ライト氏(クリックすると拡大する)のパネル)について考えてもらいたい:

どちらのパネルにも、生まれた場所、そして、学歴が掲載されているが、残りの事実は異なる。

親や兄弟に関する事実はグレイニング氏のパネルにのみにリストアップされている。なぜだろうか?名前を確認してみよう: Margaret (Marge)、Homer、Lisa。グレイニング氏はキャラクターの名前に自分の家族の名前を使っているのだ。つまり、グレイニング氏に関連する検索に注目し、グーグルは家族の名前が頻繁に求められている答えだと判断していると言える。

グレイニング氏のパネルでは、同氏が作成した書籍がリストアップされている。ライト氏のパネルでは、有名な建築物が掲載されている。妥当な判断だ。ユーザー達はライト氏が綴った本よりも同氏がデザインした構造に関心を持っているからだ。グーグルのオートコンプリート機能 – コアの検索のトピックに関連する最も人気の高いワードに基づく – もこの判断を反映している:

私は様々な検索を行ったが、表示される内容には感心した。Disneyland(ディズニーランド)に対しては、人気の高い乗り物が表示された。Space Mountain(スペースマウンテン)等のジェットコースターに対しては、時間が表示された(たった3分間?)。Astronaut(宇宙飛行士)に対しては、ミッション、そして、宇宙で過ごした時間の合計が掲載されていた(このような情報が事実として自分にも掲載されたら最高だ)。Buckingham Palace(バッキンガム宮殿)には、床面積が表示された。Larry Page(ラリー・ペイジ氏)とMark Zuckerberg(マーク・ザッカーバーグ氏)に対しては、推測される純資産の額が掲載されていた。

全てのナレッジパネルには、下に「People also search for」(~のような検索も行われてます)のセクションがあり、関連する人物、場所、または物事がリストアップされている。繰り返すが、関係は検索データを見て決定される。例えば、グレイニング氏を検索する人は、同氏と共にフューフラマを作成したデビッド X コーヘン氏も検索することが多いようだ。

検索マーケッター、もしくはユーザーが検索を行う経緯に興味を持っている人にとっては、このテクノロジーは、グーグルトレンドグーグルインサイトグーグルコラレート、もしくは、アドワーズのキーワードツール等のキーワードリサーチツールような、発見に秀でた優れたリソースとして役に立つだろう。

ファクトではあるがアクションはない

ナレッジパネルに関して私が欠けていると思ったのは、これらのエンティティに関連するアクションを起こすためのリンクの存在である。例えば、バッキンガム宮殿に関連するアクションで求める人が多いのが、ツアーを予約する機能である。しかし、このパネルには予約を行うためのオプションは用意されていなかった。

反対に、先週行われたビングのリニューアルの一環として発表された“スナップショット”(導入されるのは一週間先)は、チケットの購入や予約等の行動を起こす上で役に立つ試みを重要視している。

なぜアクションを提供しないのだろうか?

「勿論検討はしている。しかし、現在はこの製品をリリースし、何が起きるのか見てみたいのだ。」とシンガル氏は述べている。

しかし、ソングキックやスタブハブに参照する楽曲に関する検索に見られるように、時折、事実のソースプロバイダーへ向かうリンクを介してアクションを取ることが出来る。

どのアンドロメダ?

一部の検索においては、グーグルは検索に関連する事実を複数持っている可能性がある。この場合、推測して失敗するのではく、グーグルは以下のAndromeda(アンドロメダ)の検索で表示されたように、「See resluts」ボックスを提示する:

アンドロメダは、グーグルのナレッジグラフでは、銀河、TV番組、またはスウェーデンのバンドを意味する。この明確化ボックスとも呼ばれるボックスによって、ユーザーは正しい判断を下すことが出来る。

どこから事実は来るのか?

グーグルはこのような事実をどのようにして把握しているのだろうか?事実を抽出する最初の取り組みは、2009年に立ち上げたグーグルスクエアードであった。グーグルは現在もこのテクノロジーを所有しているものの、このサービス自体は精度が低く、昨年個別のサイトとして、閉鎖されていた。

ナレッジグラフを本格的に軌道に乗せたのは、グーグルスクエアードではなく、2010年に買収したメタウェブである。メタウェブは、関係、そして、事実のデータベースのフリーベースを介して、事実を構築していた。

メタウェブを買収して以来、シンガル氏は、事実のデータベースをグーグルは大幅に拡大していったと説明している。フリーベースの協力を得つつも、ウィキペディアやCIA ワールドファクトブック等の公開されているソース、さらには、グーグルブックの情報がデータとして採用されている。さらにグーグルは他の企業とライセンス契約を結び、データを得ている。

「構造化されたデータを得られる場合は必ずデータを加えている。」とシンガル氏は述べている。

劣悪なデータを修正する

ウィキペディアやその他の公開されているソースからデータを引っ張るため、事実が100%正確だとは言い切れない。そのため、全てのナレッジパネルには「Report a problem」(問題を報告する)リンクがパネルの下に用意されている。

このリンクをクリックすると、事実が誤っている可能性があることを示唆することが出来る。 シンガル氏曰く、グーグルはコンピュータアルゴリズムと実際のユーザーのレビューを組み合わせて、事実を修正するべきかどうかを判断するようだ。

変更を行う場合、ソースのプロバイダーに伝達される。つまり、ウィキペディアには誤りが伝えられるのだ。必ずしも変更しなければいけないわけではないが、これらのサイトがフィードバックを求めていることは容易に想像がつく。

「ソースは喜んでいるはずだ。遥かに大きなグループからフィードバックを得ることが出来るのだから。」とシンガル氏は述べている。

パブリッシャーへのトラフィックは減るのか?

検索エンジンは、検索結果内で直接答えを表示する取り組みをここ数年間で強化してきた。このような取り組みは、一部のパブリッシャーを不安にさせてきた。検索トラフィックが減少すると考えられるからだ。事実、検索エンジンが結果内で答えを提供するなら、わざわざクリックする必要はなくなる。

グーグルのナレッジグラフは、表示する答えを大幅に増やすだろう。そのため、再びパブリッシャー達は懸念を抱くことになるだろう。

しかし、パブリッシャーは心配しなくても良いと言うのがシンガル氏の反応であった。同氏は、このタイプのクエリの多くは、グーグルが調べたところ、大半のサイトからトラフィックを取り上げていなかったと述べた。表示されるナレッジパネルによって、さらに検索が促され、最終的に外部サイトにユーザーが向かうことがその理由の一つのように思える。

それでも、一部のサイトは損害を被るとシンガル氏は認めている。それでも、同氏は「2+2」の例えを用いて、これは避けられないと述べている。ユーザーが2+2を検索するなら、グーグルはサイトにユーザーを送るのではなく、直接答えを提供するべきである。ちなみにグーグルはこのような計算を既に行っており、数年前から実施している。

以下に、昨日、SMX ロンドンのオーディエンスからこの点を尋ねられた際に、シンガル氏が説明するシーンを収めた動画を掲載する:

YouTube Preview Image

パブリッシャー達が、見事にまとめた情報を、ウィキペディアやフリーベースのスタッフがデータベースに取り入れたらどうなるのかの方が私は気になっている。例えば、ディズニーランドのファンが作ったサイトが、乗り物の時間を自分で実際に乗って確かめた場合、ナレッジグラフでこのデータが用いられる際に誰の功績が認められるのだろうか?少なくとも米国では事実に著作権を認めることは出来ないため、全く同じフォーマットまたはデザインを複製していないと仮定し、自由にデータを使うことが出来る。

グーグルは、ウィキペディア等への場所に向かう功績を認めるリンクを表示している。そして、ウィキペディアも(検索ランキングには貢献しない方法で)ソースの功績を認めている。しかし、検索エンジンのユーザーは2回クリックしなければオリジナルのソースに辿りつけないことになる。そもそも、既に事実を発見したものの、さらに検索を続けたいと望むユーザーが大勢いるとは思えない。

この点には注目していきたい。以前も述べたように、ナレッジグラフは、事実に焦点を絞った比較的少数のサイトに影響を与える。これらのサイトは、既にリスティングのデスクリプションで答えを提供している可能性のあるため、トラフィックを獲得するわけではない。いずれにせよ、今後の展開を見守っていく。

また、“メイン”の結果が消えていない点を思い出してもらいたい。フランク・ロイド・ライト氏に対する検索を再び取り上げて説明する。今回は通常の結果とナレッジパネルを比較してみる:

ご覧の通り、グーグルの外部のサイトへ向かうリンクは、左側、つまり、検索結果ページの中で最も視点が集まるエリアに今も掲載されている。

リストアップしてもらう

ナレッジパネル、そして、ナレッジグラフに加えてもらいたい場合はどうすればいいのだろうか?シンガル氏は、現時点では、この取り組みを考慮したメカニズムは用意していないと答えていた。 つまり、フランク・ロイド・ライトに関するサイトを運営していても、フランク・ロイド・ライトのパネルに対して提示されるソースに参加する手がないのだ。

フリーベースに向かい、アカウントを作成して寄稿することは出来るかもしれない。ただし、ブログをこのブログのような劣悪なブログのリストに加えても何の解決にもならないはずだ。その他のカテゴリーの方が可能性は高いかもしれないが、このトピックに関しては今回は見送らせてもらう。

一般的に利用されているスキーマでページをタグ付けする手法は効果があるかもしれない。しかし、私なら事実をナレッジグラフに含めるためだけにこの取り組みを実施したりはしない。以下の記事はスキーマの利用に関する詳細を提供している:

広告、モバイル & タブレットのフォーマット

グーグルの広告に詳しい人なら、パネルが表示されることで広告にどのような影響が現れるのか気になるだろう。

シンガル氏曰く、ナレッジパネルが掲載される検索に広告が存在する場合、広告は引き続き表示されるようだ。また、グーグルはクエリの広告が多い場合、少ない場合、1つもない場合にそれぞれ異なるフォーマットを用意している。まだこのようなフォーマットには遭遇していないが、ローンチ後に明らかになったらその都度アップデートしていくように心掛ける。

さらに、シンガル氏によると、グーグルはタブレットとモバイルデバイス上でもパネルがうまく表示されるフォーマットも準備しているようだ。デスクトップでの検索だけに制限されているわけではなく、パブやバーのクイズ大会でズルする人にとっては朗報と言えるだろう。

残念なことに、ナレッジグラフを直接検索する手段は用意されていない。通常のグーグル検索が行われた場合のみ表示される。

競争

ナレッジグラフを提供しているのはグーグルだけではない。ウルフラムアルファ2009年に同様のサービスを立ち上げ、サービスの改善を続けている。このサービスは検索パートナーのアップルがシリを動かすために用いたため、強力な後押しを得た(ただしスマートフォンに関するある検索においてアップルに恥をかかせていた)。

ビングは、ウルフラムアルファと提携を結び、また、ナレッジグラフに若干似ているパワーセットテクノロジー手に入れ、文字のパターンをマッチさせるだけでなく、ワードの意味を深く理解しようと試みている。

しかし、ビングはウルフラムアルファにもパワーセットにも本気で投資しているようには見えない。そのため、ナレッジグラフとフルフラムアルファとの一騎打ちになるのではないだろうか。本当にそうなるのだろうか?

シンガル氏は「ウルフラムアルファは、計算を多用している。」と指摘し、「ウルフラムアルファの目的は、計算において効率よく事実を利用する方法を探すことのように思える」と述べた。

例えば、「cars in california / california population」(カリフォルニア州の車/カリフォルニアの人口)とウルフラムアルファに入力すると、この2つの事実を理解し、平均値(2009年のデータを使い、2人に1人が車を所有している)を計算する。

グーグルはこのような計算は行わない。人気の高い事実を提供することに焦点を絞っているためだ。

今後

当然だが、ナレッジグラフは、事実を調べる目的以外の目的でも利用されるようになるだろう。グーグルが実際のウェブページをエンティティにタグ付けする取り組みを改善することが出来れば、これらのページの内容そして関係を理解する取り組みも改善され、その結果、通常の結果の関連性は向上するだろう。

それがナレッジグラフの未来であり、これはナレッジパネル自体に対するその他の多くの変更にも共通する。

シンガル氏は、個人的には、この機能のローンチは、ささやかな一歩に過ぎない。」と結んでいる。

グーグルのナレッジグラフについて詳しく知りたいなら、ウェブのその他の情報源をまとめたテックミームのリスト、グーグルの公式ブログの投稿、そして、下に掲載した公式の動画を参考にしてもらいたい:

YouTube Preview Image


この記事は、Search Engine Landに掲載された「Google Launches Knowledge Graph To Provide Answers, Not Just Links」を翻訳した内容です。

いわゆるナレッジパネル的な機能は以前からYahoo!Japanでも積極導入していましたし驚く程のことでもありませんが、そこは流石Google、検索回数と連動して関連コンテンツを自動選択し、ナレッジパネルに表示する機能は技術力を感じます。今回の変更、表示箇所的にも対象になりそうなキーワードの種類的にも直接SEOに大きく影響する、というわけではないでしょうが、将来的には今は実験段階で搭載されていないナレッジパネル経由のアクションが、広告やGoogle自身の提供サービスと連動していきそうな予感はしなくもありません。。そんな心配はさておき、米国ではBingも検索機能のバージョンアップを最近行ったばかりですし、ウェブ検索もまだまだ進化していきそうで楽しみです。 — SEO Japan [G+]
Page Top

投稿ナビゲーション