Googleがスパムを特定する新アルゴリズム

今年に入ってからアルゴリズム更新が激しいGoogleですが、最近スパムを特定するための新たな特許を取得したらしい、ということで詳細をSEO by the Seaから。 — SEO Japan

グーグルのウェブマスターガイドラインは、ウェブマスターに警告を与える対象として、欺くことを意図して検索結果のランキングを上げようとする複数の取り組みを挙げている。このガイドラインは冒頭で次のように警告を発している:

ガイドラインの提案項目を導入しないサイトでも、「品質に関するガイドライン」には目を通されますようお願い致します。このガイドラインでは、Google のインデックスから完全に削除されるか、アルゴリズムまたは手動によるスパム対策が実施される可能性のある不正行為について説明しています。スパム対策が実施されたサイトは、Google.co.jp や Google のパートナー サイトの検索結果に表示されなくなることがあります。

今週グーグルに付与された特許は、検索エンジンが、ページのランキングの改善につながる不正行為が行われている可能性があると考えた際の対応を描いている。この特許に掲載されている次のイメージは、このようなランクを変更するスパムに応じて、検索結果の順序が変えられる仕組みを表している:

An image from the patent showing rankings of pages before and after the impact of rank modifying spam, with the search results being reordered.

このような行為は、特許の中で「ランキングを変更するスパムの手法」と呼ばれており、具体的には次の行為を指すと思われる:

  • キーワードスタッフィング
  • 見えないテキスト
  • 小さなテキスト
  • ページのリダイレクト
  • メタタグスタッフィング
  • リンクベースの操作

この特許は、この行為の定義を記しているものの、より詳しく説明しているグーグルのガイドラインで定義を確認することを私は薦める。この特許において興味深いのは、グーグルが検索結果の操作を阻止するために対策を行っていると言う事実ではなく、そうする上で実施する可能性のある手順である。

それではこの特許を詳しく説明していく:

ランキングのドキュメント
発明: Ross Koningstein
付与先: Google
米国特許番号: 8,244,722
付与日: 2012年8月14日
申請日: 2010年1月5日

概要

文書の1つ目のランクおよび2つ目の文書を決定するシステム。この2つ目の文書は1つ目の文書とは異なる。また、このシステムは、1つ目のランクから2つ目のランクに移行する際に発生する移行期間中、文書に関連するランキング要素が変わらない状態で、時間の経過とともに移行ランクを変えるランク移行機能に応じて、文書に関連する移行ランクを変えるものとする。

このような不正行為がページで利用されていると判断すると、グーグルはスパム行為を実行している人物が考えもつかない方法で対応すると推測される。ページのランキングを単純に押し上げるのではなく、グーグルは時間ベースの「ランク移行機能」と特許に記されている方法で応じることもあり得る。

ランク移行機能は、ランクを変更するアクティビティに対応するため、ランクに混乱を招く兆候を与える可能性がある。このシステムおよびメソッドは、ランキングの変更に対するスパマーのリアクションを観察し、活発に操作されている文書を特定すると考えられる。これはランクを変更するスパマーを特定する上で効果が期待できる。

それでは、グーグルのインデックスにページを所有し、当該のページの品質を改善する試みを行い、多数のリンクを入手したと仮定してもらいたい。また、このアクティビティによって、特定のクエリに対するランキングが上がったとしよう。このページの以前のランキングは「オールドランク」と呼ばれ、その後のランキングは「ターゲットランク」と呼ばれる。しかし、この変化は、ページに対する正当な修正によってもたらされた可能性がある。キーワードスタッフィングやテキスト隠し等の手法が用いられたために、オールドランクが高いターゲットランクとなり、ランキングが上がった可能性もある。

先程触れたランク移行機能は、オールドランクとターゲットランクを含む「移行ランク」を生成すると思われる。

オールドランクからターゲットランクへの移行期間中、移行ランクは次のレスポンスをもたらすと推測される:

  • タイムベースの遅れたレスポンス
  • ネガティブなレスポンス
  • ランダムなレスポンス
  • 想定外のレスポンス

例えば、不正な変更が行われている場合、すぐにページまたはページに向かうリンクのランクを上げるのではなく、グーグルはしばらく待ち、上げる前にまずページのランキングを下げる可能性がある。もしくは、当初はランキングが上げても、ユーザーが期待していたよりも遥かに小さなスケールで上げることも予想される。

その後、検索エンジンは当該のページおよびページに向かうリンクへの変更を監視し、不自然なアクティビティに対するレスポンスを確認すると思われる。例えば、ページに大量のキーワードを埋め込んでいる場合、特定のクエリに対するランキングを押し上げるのではなく、ランキングを落とす判断が下されることもあり得る。その後、このページに関与する人物が、余分なキーワードを削除した場合、何らかのランクを変更するスパム行為が行われていた点が示唆される。

それでは、なぜこのようなタイプの移行機能が用いられるのだろうか?

例えば、スパマーの変更への最初のレスポンスによって、文書のランクがプラスではなく、マイナスの影響を受けることが考えられる。予期しない結果になると、スパマーは反応する傾向がある。とりわけスパマーのクライアントが結果に不満を持つ場合は尚更である。ネガティブな結果に対して、スパマーは変更を削除する可能性があり、従って、文書のランクの影響をゼロにする。

この方法の代わりに、もしくは、この方法に加えて、時間を取って(長さはケースによって異なる)、スパマーの変更に対してポジティブ(または予想通り)の結果を返すこともあり得る。遅れた結果に対して、スパマーは文書のランキングにポジティブに(または今まで以上にポジティブに)影響を与えるため、さらに変更を加える可能性がある。いずれのケースにおいても、スパマーが始めた変更は、ランクを変更するスパム行為を特定する上で役に立つと考えられる。

ランク移行機能は、ある特定の文書に影響を与えることも、もしくは、文書がホスティングされているサーバーに広範な影響を与えることも、あるいは、同じ特徴(同じ作者(文書内の署名が同じ))、デザイン要素(レイアウト、イメージ等)の一連の文書に影響を与えることも考えられる。

キーワードスタッフィングやグーグルのガイドラインを違反するその他のアクティビティを基に少しランキングが上がった場合、当該のスパマーがさらにキーワードを増やす、テキストを隠す等、サイトに同様の変化を加える可能性がある。ランキングが落ちた場合、ページを元の状態に戻す等、その他の変更を行うものと推測される。

スパムが行われている可能性があるものの、確証がない場合は、当該のページはランキングにおける変動または極端な変化の対象となり、スパマーに何かしら是正を試みさせると考えられる。是正が行われると、スパムの特定に役に立ち、その後、ページ、“サイト、ドメイン、またはリンク”はスパムと識別される可能性がある。

スパムと特定されると、グーグルはさらに調査を行い、無視する、もしくは、ランキングを落とす等の行為に出るものと考えられる。

皆さんのこのアプローチに関する意見を聞かせてもらいたい。


この記事は、SEO by the Seaに掲載された「The Google Rank-Modifying Spammers Patent」を翻訳した内容です。

大きな順位変動があった際の順位を、一時的な(移行)ランクと仮置きし、その後、サイトに何らかの変更が加えられたかどうかで最終的にスパム手法やサイトのスパム認定を判断する技術のようですね。これ、理論上はわからなくもないですが、実質大半のサイトは順位変動(下落)があった際にすぐにサイト内容を変更するということはまれだと思いますし、順位上昇・下落自体がスパムによると限ったことではないですし、特定のスパムをやり込んでいるサイトに適応するならともかく、なんとなく机上の空論的な特許に感じますけどね。。。この技術を応用するとすれば、どちらかというと、サイト内の変更より外部リンクの変更の方がスパムなリンクやリンクネットワークの発見にはよほど効果があるようにも思えますが。

元記事のコメント欄でも色々な意見が出ているようですが、さて皆さんはどう思われるでしょうか?– SEO Japan [G+]

 

Page Top

投稿ナビゲーション