Googleのパーソナライズド検索を徹底解剖

検索エンジン黎明期から「検索の未来を変える」とそれなりに注目されつつも、「ユーザーの意図は読み切れない」「使えない」と揶揄されてきたパーソナライズド検索。とはいえ、例えば今日のGoogleを見ると、ユーザーのロケーションや検索履歴、最近ではソーシャル上のつながりなど、できるところから地道にそして相当に進化してきているのもまた事実。今回はそんなGoogleパーソナライズド検索の現在を徹底的に解説してくれた素晴らしい記事をサーチエンジンランドから。 — SEO Japan

パーソナライズド検索がパーソナライズされなくなるのは、どんなときだろうか?グーグルが検索結果をユーザー – そして、その他のユーザー – の以前の検索を基に変更する仕組みが変わったことが最近判明した結果、この疑問が浮上するようになった。

最新の状況を理解するために、過去を振り返って、グーグルが持つパーソナル検索の“風味”(よく混合される)について復習していく。

ジオグラフィーをベースにしたパーソナライゼーション

グーグルは、以前から個人に合わせて調整した結果を提供するため、検索のパーソラナイズ化を行ってきた。

事実、長年に渡って“ノーマル”な結果を与える取り組みをグーグルは止めており、10年以上前から地理的な位置を基にパーソナライゼーションを実施してきた。現在は、国ベースのパーソナライゼーションは時代遅れになり、市をベースとしたレベルに発展している。ある市で誰かに表示された結果は、別の市の他のユーザーに表示された結果とは大幅に異なる可能性がある。

以下に私が「zoo」で得た結果ページを掲載する:

近郊の地域のリスティングがページの上位に掲載され、次に私の家に近い2つの大きな動物園が続く(最も家に近いSanta Ana Zooをリストの一番上に掲載してもらいたかったが、LAとSan Diegoの動物園は規模が大きく、割と近いので問題ない)。

検索履歴をベースとしたパーソナライゼーション

グーグルは数年前から検索履歴を使ってパーソナライズを行っている(サインインし、ウェブ履歴機能を有効にしている場合)。

サインアウトしていても、グーグルはブラウザ内のクッキーにリンクが張られた検索の記録を180日間保持するため、結果のパーソナライズを行う可能性がある。

Windows 8に対する以下の検索結果を見てもらいたい(クリックすると拡大する:

左側には、クロームブラウザを新たに「シークレットモード」に変えて、グーグルがブラウザに関連する履歴を手に入れないようにするか、もしくは、サインインしたユーザーがパーソナライゼーション機能を無効にするためにグーグルが提供するボタンを使い、パーソナライゼーション機能を無効にした上で得た結果を表示する。

右側には、パーソナライズドされた結果を表示した。矢印で示しているのは大きな違いである。パーソナライズドされていない結果ではトップ10入りしなかったマイクロソフトのウィンドウズのサイトは、パーソナライズドされた結果では3位にいきなり登場している。その結果、もともと3位にランクインしていたWindows 8およびWindows RTに関するページが4位に降格している。

なぜこの変更が起きたのだろうか?このリスティングの下に明確な手掛かりが隠されている:

矢印は、私がメインのマイクロソフトのウィンドウズのページを5回訪問していることをグーグルが伝えるメッセージである。なぜグーグルはそんなことを知っているのだろうか?それは私がグーグルにログインして、検索を実施し、最低でもグーグルが記録しているように5回以上はこのサイトを選んでいたためだ。

私が何度もこのサイトにアクセスした事実によって、グーグルはこのサイトを私が気に入っていると考えるようになったはずだ。そのため、特定の検索を行うと、グーグルのパーソナライズド検索のアルゴリズムは、このページを結果で押し上げる。従って、トップ10入りを果たしたのだ。

このタイプのパーソナライゼーションは、グーグルが実施するパーソナライズの中でもは最も古く(ビングも同じような機能を持っている)、このサイトでも取り上げたように2007年に導入されている:

2009年の12月には大幅に拡大されており、このサイトでも2つの投稿でピックアップしている:

個人の共有をベースとしたパーソナライゼーション

既に紹介した検索履歴以外にも、新たな結果が現れる、もしくは全体的なランキングの変更をもたらすパーソナライゼーションに影響を与えているものがある。ソーシャルシグナルもその一つである。個人的に誰を知っているのか、何を共有しているのかもまた、インパクトを与えるのだ。

今年の初め、このタイプのシグナルは大幅にパワーおよびプレゼンスにおいて成長を遂げ、サーチ・プラス・ユア・ワールド(日本語)と言う名称の下、まとめて提供されていた。この点を説明するため、Windows Phoneに対する検索結果を以下に掲載する:

先程と同じように、左側にパーソナライズドされていない結果を、右側にはパーソナライズドされた結果を表示する。 右側では、私の写真が隣に掲載された新たなリンクが表示されている。これは、グーグル+で本日私がWindows Phone 8に関して投稿したエントリである。グーグルのサーチ・プラス・ユア・ワールドのアルゴリズムは、ユーザーのコンテンツを表示する傾向が強く、完全に“エゴ”を検索結果で報いるメカニズムを採用している。そのため、他のユーザーの検索結果とは異なり、私のパーソナライズドされた結果に、このリンクが掲載されているのだ。

ソーシャルなつながりをベースとしたパーソナライゼーション

また、私がグーグル+でつながりを持つ人達によって共有されたWindows Phone 8に関するイメージのリストも結果ページに表示されている。この新しいコンテンツを加えるとなると、左側の結果からいずれかのページが姿を消さなければならない。下方向を示す3本の矢印は、ページの上半分から降格させられたリスティングを指している(その中には結果の1ページ目から完全に姿を消したものもある)。

次にソーシャルのつながりが結果に影響をもたらすことがより明確に現れている例を挙げる:

これは結果ページの下位である。左側にはパーソナライズドされていない結果を表示する。右側の3本の矢印は、私のソーシャルのつながりのおかげでランクインしたリスティングを指している。

1本目のリスティングはCNETの記事である。これはグーグル+で私がCNETと“友達”になっていることが原因と見られる。2本目のリスティングはTypekit Blogのエントリであり、これは私の知り合いが共有したためにランクインした可能性が高い。4本目の矢印は、共有した本人を示している(ジェフリー・ヴィーン氏には感謝している)。3本目のリスティングは、ハリー・マクラケン氏が投稿したエントリであり、これは様々なサイトで私と同氏が友好関係にあるためで、とりわけグーグル+での関係が大きく影響していると思われる。

ここで、グーグル+の重要性をまだ理解していない人に簡単に説明しておこう。誰かが自分とグーグル+で友達になると、それは上位にランクインするためのその他の要因に勝る要因になる可能性がある。リンクも、タイトルタグも、そして、その他のSEOの要因も、グーグル+のつながりには歯が立たないだろう。

過去のクエリをベースとしたパーソナライゼーション

先程、検索履歴をベースとしたパーソナライゼーションを挙げた。このタイプのバリエーションには、ある検索を行う直前の検索を確認して、両方の用語を使って結果を絞り込む意味があるかどうかを把握するため、以前から利用されているものがある。

「過去の履歴による絞り込み」と呼ばれるこのタイプの例を以下に掲載する。「flag」で検索を行い、次に「california」で検索をしたところ、次の結果ページをグーグルは表示した:

矢印が指している「You recently searched for flag」(最近flagで検索を行いました)と言うメッセージに注目してもらいたい。これはウィキペディアのカリフォルニアのフラッグに関するページである。私が実施した検索は「california」であり、フラッグとは全く関係がなかった。しかし、グーグルは、私が「flag」を直前に検索したことに注目し、「california」と「flag」の双方を組み合わせると役に立つと推測したのだ。

グーグルは数年前からこの取り組みを行っている。2007年には広告、そして、2008年には無料のリスティングに対して、この機能が導入されていた。当時のエントリを以下に掲載する:

他のユーザーの過去のクエリをベースとしたパーソナライゼーション

そして、これが今週導入された新たな要因につながる。グーグルのライバル、ダック・ダック・ゴーは、特定のワードに対して、個人のベースではなく、大勢の人達に対して、過去のクエリの絞り込みが行われている点を発見した。

ウォールストリートジャーナルは、今週、記事の中で、この傾向がハッキリと見られる例を挙げている。「obama」の検索は、「iran」や「medicare」等のトピックに対する検索を変えるが、「romney」に対する検索ではこのような変更は起きない。

次の例では「obama」の後に「medicare」を検索した結果、双方の用語がリストアップされている:

「obama」が、ダック・ダック・ゴーが「魔法のキーワード」と呼ぶキーワードの役目を果たし、一方の「romeney」は何も影響を与えないため、グーグルは若干政治的に偏りがあるのではないかと一部の人達が疑い始めている。個人的には政治的なバイアスは存在しないと考えており、今週の初めに投稿した記事で詳しく説明している:

RomneyではなくObamaでこの現象が起きたのは、グーグルがObamaを贔屓しようと試みているからではなく、検索アルゴリズム全体でユーザーが検索したクエリおよび次に検索したクエリに注目し、すべてのユーザーに対して個人のクエリの絞り込みを注入することが理に適っているかどうかを判断しているためだ。

[hunger game]を検索した直後に「amazon」を検索した結果について考えてもらいたい:

「Amazon」の検索でこの現象が起きている。現在の検索では「hunger games」を使っていなかったにも関わらず「Hunger Games」のリスティングが含まれている。過去のクエリの絞り込みが効力を生じているのだ。

ジョン・スカルジー氏が綴った最高のsci-fi小説「redshirts」(スタートレックで赤いシャツのキャラクターが必ず死ぬことを少しでも知っているなら読んでもらいたい)で同じことを試みたが、絞り込みは行われなかった。その理由を説明する。

Redshirtsは魔法のキーワードではない。グーグルはHunter GamesをRedshirtsよりも贔屓しているわけではない。恐らく、グーグルはRedshirtsのリンクを“ピュア”なamazonの結果に挿入することが妥当だと言い切れるほどのデータを持っていないのだろう。

魔法のキーワード

先程も申し上げた通り、過去のクエリによる絞り込みは以前から行われている。しかし、グーグルは、すべてのユーザーのデータを用いて、その他のクエリに対して動作させるタイミングに影響を与える、この新しい風味を昨年テストとして始めるようになったと明かしている。現在、グーグル曰く、この現象は検索全体の約0.3%で起きているようだ。

また、グーグルはこの現象をパーソナライゼーションとは考えず、あるユーザーの過去のクエリによって絞り込みは影響を受けるものの、実際に表示させるかどうかは全体のアクティビティに左右されると指摘している。グーグルによると、これはグーグルが以前「もしかして」、そして、現在「- の結果を表示しています」を介して修正を行うスペルの修正に似ているようだ:

グーグルが、このタイプの絞り込みを容易に無効化する手段を提供していない理由もここにあるのだろう(本気で取り組めば、無効化にすることは可能である。後ほど簡単に説明する)。

それでは、ワードやフレーズが魔法の力を持つようになり、今後の検索に影響を与えると、どうなるのだろうか?グーグルは、これがクエリの人気に関係している点、そして、とりわけ最近の検索に関連する可能性がある、最新のナビゲーショナルなクエリを浮上させる目的がある点以外は、明らかにしないだろう。

「Hunger Games」では、グーグルはこのクエリとAmazonに対する検索を数多く見てきていると思われ、また、恐らく、ユーザーが具体的に双方のクエリを一緒に検索したデータも多く持っているのだろう(hunger games amazon)。グーグルは、この組み合わされた検索結果でユーザーが選んだ上位のリスティングを確認し、過去のクエリとして挿入するべきクエリをある程度推測している可能性がある。

「hunger games amazon」と「california flag」(下)のパーソナライズドされていない結果の上位で確認してもらいたい。

組み合わされた結果の双方において、上位の結果は、過去のクエリの絞り込みのリンクとして挿入されたリスティングである。ただし、常に上位に挿入されるとは限らない:

検索マーケッターにとっては、組み合わせたワードで上位のランクを維持しており、ワードの1つが“魔法のキーワード”なら、そのワードで上位にランクインすることが出来るように本気で取り組むべきである。

検索エンジンのユーザーに対する影響: 恐らくプラスに働くものの、管理する手間が増える

検索エンジンのユーザーにとっては、これは有益な機能と言えるだろう。しかし、グーグルには、サインインしたユーザーに与えるオプションと同じようなオプションを用意して、容易に無効にすることを可能にしてもらいたいと私は願っている。

また、いつこの機能が動くのかに関しても、明らかになっていない。過去のクエリをベースとした絞り込みが個人のユーザーの検索に導入された経緯について、私は先程説明した。つまり、あるワードを検索し、次に別のワードを検索した場合、他のユーザーとは異なり、私の結果には絞り込みが反映されるようになるのだろうか?

今回新たに見つかった変更の影響は、現在、このタイプの絞り込みによって受ける影響を遥かに凌ぐ可能性が高い。しかし、過去のクエリが自分だけに表示じされ、そして、サインアウトしている際(他の“すべてのユーザー”タイプの検索を実施)には表示されない例を見つけるこは出来なかった。

要するに、過去のクエリは、ブラウザに関連するものも含め、あらゆるタイプの検索履歴を完全に無効にしているごく一部の人達以外にとっては、もはや個人またはパーソナルなアイテムではなくなったと言うことなのだろう。

今後の記事で、パーソナライゼーションが起きるケースを知る方法(グーグルは以前そうだったように、この点を明確に説明していない)、そして、無効にする方法を詳しく取り上げていく予定だ。それまでの間は、ここでグーグルの説明を参照にしてもらいたい。

また、今回紹介したパーソナライゼーション: 過去のクエリ、ソーシャルなつながりの影響、ソーシャルネットワークでの共有、そして、地理はビングにも導入されている。


この記事は、Search Engine Landに掲載された「Of “Magic Keywords” & Flavors Of Personalized Search At Google」を翻訳した内容です。

非常に整理された分かりやすい内容であると共に、「他のユーザーの過去のクエリをベースとしたパーソナライゼーション」なんて試みも始まっているんだ、と新たな驚きもあった記事でした。この新規パーソナライズド機能がどこまで有益なのかは、私自身もしばらく体感してみないと何ともいえないところですが、記事にもあるように全体の検索数に左右されそうで、オバマとロムニーのケースもそうですが、場合によっては情報操作と思われかねない状況も引き起こしそうです。そもそも検索数という人気、興味の高さという軸で検索結果を変えることは、特にそれがされない比較対象がある場合、さらに検索対象に対する情報の偏りが起きそうで若干の怖さも感じます。

もちろんGoogleもその辺は理解した上で試行錯誤中なのでしょうが、いずれにしてもこのパーソナライズ検索、私たちが知らないところで、日々着実に進化し、私たちが目にする検索結果に益々影響を与えていきそうです。 — SEO Japan [G+]

Page Top

投稿ナビゲーション