Googleのリンクアルゴリズムの最前線

Googleがウェブページのリンクをどのように理解しているか、というアルゴリズムは古くからSEOマニアが注目する技術でした。ページランクに始まりリンクのアンカーテキスト、発リンク数、リンク先との関連性、そしてリンクの位置や張られ方、前後の文章との関係性などページ&サイト単位等、リンク構築の際に考慮すべきSEOに影響を与える様々な要素が存在しますが、今回は最新のGoogleはさらにその一歩も二歩先も進んだリンク解析アルゴリズムを採用しているという興味深いお話をSEO by the Seaから。 — SEO Japan

検索エンジンがリンクをインデックスする場合、通常は、検索エンジンのインデックスには、リンクが向けられているターゲットのアドレス、リンク内に表示されるアンカーテキスト、そして、場合によってはリンクの近くにあるテキストに関する情報が含まれる。グーグルのリーゾナブルサーファーモデル(日本語)は、リンクに関してその他の情報が集められる可能性を示唆している。これらの情報は、ページランクのリンク分析モデルの下で、あるリンクから別のリンクにもたらされる価値または重みを計算する手段として、もしくは、リンクに向けるために利用されたアンカーテキストがどれほどの重みをもたらすのかを計算するために、まとめて用いられている可能性がある。

最近、検索エンジンのロボットがどれほど賢いのかを問う議論が頻繁に行われているが、先日、グーグルが公開した申請済みの特許を参考にすると、ウェブで見つかったリンクに関する全く異なるリンクの動きの情報を検索エンジンが集めている可能性があるようだ。クロームブラウザを開発する取り組み、そして、スマートフォンやその他の携帯デバイス、またはテレビ画面等のコンピュータ以外のスクリーンを介した状態で、ウェブページへのアクセスを提供することをグーグルが目指している点を考慮すると、検索エンジンがこのような種類の情報を取得するのは理に適っていると言えるだろう。以下に掲載した特許内のイメージは、検索エンジンが現在インデックスしていると見られるターゲットおよびオンクリックのアトリビュートを含む、リンクのセクションを示している。

A screenshot from Google Maps showing an information box over the map that appears after clicking upon a link in the column to the left.

検索エンジンによるウェブ上のコンテンツのインデックスについて考えると、通常は、クロールを行い、若干動きが少ないと思われるページに関する情報を集める検索エンジンのプログラムを想像する。よって、リンクがクリックされるかどうか、そして、いつクリックされたか等のページで起きる変化に関しては考慮されない。

リンクの動きの情報には以下の情報が含まれる:

  • リンクがどのように表示されているのか
  • リンクプレースホルダー – ページ上のリンクの位置
  • 選択されたリンクが、新しいアプリケーション/新しいブラウザのウィンドウを開くかどうか
  • リンクの選択によって警告するメッセージが生成されるかどうか
  • リンクに関連するウェブページ(または追加の情報)が、複数のブラウザのウィンドウではなく、既存のブラウザのウィンドウ内、またはブラウザのタブで開くかどうか

モバイルデバイスが対応するリンクの動きのタイプは、ラップトップコンピュータが対応するリンクの行動とは異なる可能性がある。例えば、ラップトップを使って、グーグルマップで特定のタイプの店を検索すると、地図が右側に表示され、店を左側でクリックすることが出来る。実際にクリックすると、地図上に情報ボックスが表示され、場所、住所、そして、当該の店のホームページへのリンク等、詳しい情報を知ることが出来る。一方、携帯電話では、この情報ボックスを表示することが出来ないと考えられる。

A screenshot from the patent showing sections of HTML anchor links, including both target and onclick attributes that Google might now be indexing.

このリンクの動きに関する情報は、以下のようなリンクに関連する背景の情報を記録し、リアルタイムで集められる可能性がある:

  • ウェブページをリクエストしたコンピューティングデバイスのタイプ
  • リンクプレースホルダーの少なくとも1つに関連するターゲットのアドレス
  • ウェブページと関連するグラフィカルユーザーインターフェース内の少なくとも1つのリンクプレースホルダーの配置
  • ウェブページに関連するディスプレイモード
  • コンピューティングデバイスに関連するコンテクストの情報に対するリクエストの構文解析

この特許は、リアルタイムのリンクの動きに関する情報が、ブラウザやブラウザのアドオンを介して記録されるのかどうかに関しては触れていないが、恐らくそうなると思われる。

従って、このリンクの動きの情報を集める目的はグーグルが: リンクをどのように表示すればよいのか、リンクによってターゲットにされているコンテンツをどのように表示すればよいのか、そして、リンクにどのようなタイプのイベントが関連しているのかを把握することである。

それではグーグルによって申請されたこの特許の詳細を以下に記載していく:

リンクに対する動きの情報の生成
発明: Lori D. Meiskey、Jana S. Urban
米国特許申請番号: 20120084630
公開日: 2012年4月5日
申請日: 2010年9月30日

概要

コンピュータに実装されるメソッドには、ウェブページに対するリクエスの受信、ウェブページに関連する情報の検索(情報はリンクおよびリンクに関連する1つもしくは複数のリンクプレースホルダーで構成される)、コンピューティングデバイスに関連するコンテクストの情報の特定、コンテクストの情報を基にリンクに対する動きの情報の生成、そして、少なくとも1つのリンクプレースホルダーに関する情報の投入が含まれる。

リンクをクリックすると、当該のページに追加の情報が記載されたポップアップが表示されることが、テキストがハイライトされることが、もしくは、地理に関する情報が表示されることがある。この出願中の特許は、グーグルが「リンクで実行されるjavascriptのインストラクション」を含む動きの情報を記録する可能性があると明かしている。

教訓

この特許を考案した人達は、「グーグルプレイスページをビジネスのメガホンにする」と言うエントリを共同で作成していることを考慮すると、グーグルプレイスのチームメンバーであると思われる。また、この特許は、グーグルプレイスページを含む、複数の異なるスクリーンショットをグーグルマップから採用している。 あるブラウザを使ったデスクトップのコンピュータなのか、もしくはリンクをクリックした結果を表示する手段が制限されたスマートフォンの異なるブラウザなのか、グーグルマップを表示するために用いられるデバイスの種類に基づいて、マップを表示する手法の開発に彼らは取り組んでいたようだ。

彼らが考案したアプローチは、グーグル外部のサイトのリンクの行動を理解するため、そして、恐らくグーグルがリンク経由の情報をこの類の情報に対応せず、表示しない可能性のあるデバイスのブラウザで調節するために、実装されている可能性もある。

グーグルウェブマスターガイドラインは、検索エンジンが、javascriptベースのリンクを含むHTML以外のリンクをクロールすることが難しい点をウェブマスターに警告するセクションを少なくとも一つは以前から設けており、最新版のガイドラインには次のように記載されている:

Lynx(リンクス)等のテキストブラウザを利用しましょう。なぜなら、大半の検索エンジンのスパイダーは、リンクスが見るようにサイトを見るからです。 JavaScript、クッキー、セッション ID、フレーム、DHTML、またはフラッシュ等の手が込んだ機能が原因で、テキストブラウザでの閲覧が困難な場合、検索エンジンがサイトをクロールする上で問題に遭遇している可能性があります。

検索エンジンが、javascriptのリンクを見つけ、クロールする能力、さらには、AJAXのリンクの裏側のコンテンツを浮上させる能力について、グーグルやその他のソースでここ数年議論が行われているが、私の知る限り、グーグルがページ上のこの類のリンクの動きを追跡し、インデックスしている可能性があることを示唆する特許はこれが初めてである。

この投稿の冒頭で述べた通り、グーグルによるブラウザを提供する取り組み、そして、ウェブにモバイルのアクセスを積極的に提供する取り組みを考慮すると、ウェブページで目にするリンクの動きへの注目を高め、リンクが、とりわけグーグルマップ検索での地図上の情報のオーバレイ等、グーグル自身が提供するサービスで、どのように表示されるのかを理解する取り組みは、理に適っていると言えるだろう。

リンクに対する高度な分析が、検索エンジンの格付けおよび結果にどのようなインパクトを与えるのかは明らかではないが、グーグルのインデックスが、リンクがクリックされたときのみ現れる情報をさらに把握することが出来るようになる可能性はある。いずれにせよ、リンクの仕組み、そして、リンクの仕組みに関連する動きを理解するグーグルのさらに深いアプローチを意識しておく価値はあると私は考えている。


この記事は、SEO by the Seaに掲載された「How Google Might Index Link Behavior Information」を翻訳した内容です。

このレベルまで来ると、SEOを意識したリンク構築にどう参考にすればよいか分からない・対応しきれない高度なレベルになってきますね。例でも挙げられているように、Google自身が展開する多様な検索サービスをよりユーザーに使いやすく(広告との絶妙なバランスを保ちつつ)していく上では、こういった技術は活用されることでしょう。 — SEO Japan [G+]
Page Top

投稿ナビゲーション