Googleがブログのランキングを決める仕組み

SEO by the SeaからGoogleがブログの検索ランキングをどう決めるかという技術を紹介。ブロガーには気になる話題? — SEO Japan

個別のブログのエントリではなく、特定のトピックや場所に関するブログを探したいだろうか?最近、グーグルのブログ検索に加えられた変更点はその願いを叶えてくれるだろう。変更が行われたタイミングは、先日、グーグルがブログをインデックスし、検索する仕組みに関する特許が付与された時期と奇妙にも一致していた。変更に関する発表は、グーグルのブログの一つで行われていた:

先日、グーグルのブログ検索チームが、トピックに関するエントリではなく、クエリに関するブログそのものを簡単に探すことが出来るように変更を加えました。これは、クエリの話題に関するエントリを継続的に投稿しているブロガーを探す際にとても役に立ちます。

今週の検索 8/27/10 グーグル公式ブログ

このグーグルの特許は、検索エンジンがブログのフィード、そして、ブログ自体から情報を集め、ブログの内容を理解しようと試みる仕組みを説明している。エントリの内容、エントリのタイトル、エントリのライター、ブログのタイトル、プロフィールのブロガーに関する情報、ブログロールの情報、そして、ブログに関するその他の情報が集められる可能性がある。

クエリに対する個別のエントリを格付けすることに焦点を絞るのではなく、この特許は、ブログそのものがクエリに対して格付けされるべきか否かを判断する点に的を絞っているようだ。

この特許が過去のグーグルの取り組みにどれだけ大きな変化をもたらすのかは不明だが、グーグルの公式ブログで示唆されていた変更を参考にすると、今まで知らなかったブログの格付けに関する新たな情報を得ることが出来る。

この変化はどの点において新しいのだろうか?またなぜ重要なのだろうか?

グーグルのホームページで、「security」と言う用語で検索を行い、「blogs」を左側のサイドバーで選択すると、ブログ検索の結果の上部に3つのブログがリストアップされ、その上に「Related blogs about security」が表示される。また、securityに関する3つの上位のブログの下に線が引かれ、さらにsecurityに関する個別のブログのエントリのランキングと思えるページのリンクが掲載されている。

A blog search started from the Google home page, for the term security, showing a related blogs link at the top of the results.

グーグルのホームページで検索を行った後、グーグルブログ検索に辿りつくと、グーグルはさらにサイドバーにリンクを掲載している。この「More Tools」をクリックすると、「posts」か「home pages」を選択することが出来るようになる。「related blogs about security」をクリックして表示されたサイトと「home pages」の結果を比較すると、同じリストが表示されるようだ。いずれかを選択すると、「Homepages」と言う項目における一連の検索結果が表示される。

その一方で…

「security」をブログ検索のホームページで始めると、結果は異なる。「Related Blogs about security」の上部にリンクは見当たらないが、テキストのラベル「Related Blogs」の下に上位5つのブログのリストが表示される。この結果には、グーグルのウェブ検索から検索を始めた際に手に入れた結果に表示されていた3つの上位のブログが含まれている。しかし、「related blogs」のリストに表示されている最後の2つの結果は異なる。

A blog search started from the Google Blog Search home page, for the term security, which shows related blogs link at the top of the results, but doesn't link to a bigger list of related blogs.

私は他のクエリで数回検索を実施したが、ホームページで始めた場合と、ブログ検索で始めた場合とでは、多少結果は重なっているものの、やはり結果は異なるようだった。

なぜ違いが生じるのだろうか?

グーグルブログ検索は「related blogs」をブログ検索の上部に数年前から掲載してきた。これらの関連するブログは、グーグルのホームページで検索を始め、その後ブログ検索に辿りついた際に表示される結果とは異なる方法で格付けされているのだろうか?この結果における違いは、ランキングの方法も異なる可能性があることを示唆している。グーグルのホームページから検索をスタートさせた際の変化は、グーグルブログ検索で検索をスタートさせた際の結果にもいずれかの時点で反映されるのではないだろうか。

グーグルがインターフェース以外にも変更を加えた可能性は否定出来ない。関連するブログを特定するアルゴリズムもある程度変化している可能性がある。

この変更には良い面もある。それは、私たちが検索するトピックに関する「related blogs」もしくは「home pages」のリストが以前よりも遥かに長くなり、そして、健作結果の上位3つのうちのホームページの1つとして表示されることで、ブログのホームページの近さを実感することが出来る。

特許に関して

特許:

ブログのインデックスおよび検索
考案: Alex Khesin、Andriy Bihun、Eduardo Morales、Jason Goldman、Jeff Reynar、Vinod Marur
付与先: Google Inc.
米国特許出願番号: 7,765,209
付与日: 2010年7月27日
申請日: 2005年12月13日

要約

このシステムはブログに関連するフィードを受信し、また、フィードおよびブログから情報を読み込み、読み込んだ情報を基にハイブリッドの文書を作成する。さらに、このハイブリッドの文書を利用し、検索クエリに対するブログの関連性を特定することが出来る。

この特許自体、ブログのホームページを探す点に焦点を絞っていることも含め、様々な理由で好奇心をそそられる。この特許は、3年前にGoogleのブログ検索のポジティブおよびネガティブな質のランキングファクター(特許申請)で取り上げた特許と同じ日に申請されていた。また、同じ考案者が関わっており、お互いに関連していると言えるだろう。

しかし、特許の内容はあまり重複していない。既に申し上げた通り、この特許はブログのエントリではなくブログ自体を探すことに焦点を絞っているように思える。

違いは何?

例えば、バージニア州への旅行に関するブログのエントリではなく、バージニア州での生活に関するブログを見つけたいと仮定する。この特許で描かれたアプローチは、バージニア州での生活に関するブログを運営するブロガーを探す上で役に立つ。一方、別の特許は、バージニア州に旅立つ人に関するエントリを探す上で役に立つ。

この特許は、例えば、ブロガーのプロフィールを確認し、バージニア州に住んでいる点に気づくが、もう1つの特許はこのような情報は把握しない。年齢や性別など、インデックスするためにその他のプロフィールの情報を集める可能性はある。

また、ブログのホームページのランキングを作るため、ブログのフィードのコンテンツおよびブログ自体のコンテンツを含む、その他の種類の情報にも注目する。その中には、ブロガーの名前、エントリのタイトル、そして、コンテンツが含まれる。

さらに、ブログのフィードで見つけた情報とブログに掲載されていた情報を比べ、ブログがしっかりとしたブログかスパムかを判断する。特許には次のような情報が記載されている:

例えば、ブログのフィードから抽出されたエントリのコンテンツが、ブログ/エントリから抽出されたコンテンツと一致しない場合、これはフィードおよび文書が適切ではないことを示唆している。つまり、誰かが検索エンジンをスパムし、その人物のブログ/エントリが通常よりも高く格付けされるように悪用している可能性がある。この状況では、このブログ/ブログのエントリに対してハイブリッド文書が作られることはなく、非常に低いランキングが与えられる。

ホームページのみ?

この特許は、XMLフィード、ブログのエントリ、そして、プロフィールのページ等、フィードやエントリからリンクが張られているページに関する情報から、当該のブログの「ハイブリッド文書」を作成する仕組みを説明している。

しかし、検索者が入力したクエリに対して、このようなハイブリッドページを返すのではない。その代わりに、ハイブリッドページで見つかった情報を基にブログのホームページへのリンク、もしくはブログのエントリへのリンクを返すのだ。

結論

グーグルがこの特許で描かれたプロセスを既に用いている可能性はある。既に「related blogs」(関連するブログ)をグーグルのブログ検索で表示し始めているためだ。

グーグルの検索インタフェースに新たに加わった「posts and Homepages choices」(エントリおよびホームページの選択)は、グーグルのホームページで検索を始めた場合に有効であり、ブログ検索に切り替えると、さらに閲覧可能な範囲が広がり、一つ目の結果以降の結果も見ることが出来るようになる。

しかし…

グーグルのホームページで検索を始めた場合に表示される異なる結果は、ブログ検索で検索を始めた場合に表示される「related blogs」とは少し異なる方法で計算されている可能性がある。

この新たに付与された特許は、関連するプロフィールページを確認して、ブログに関連するブロガーの詳細を学ぶ可能性を含め、グーグルが双方のアプローチにおいて注目しているシグナルに関する手掛かりを私たちに与えてくれるだろう。


この記事は、SEO by the Seaに掲載された「How Google May Rank Blogs」を翻訳した内容です。

「related blogs」等の機能って日本語インターフェースではまだ実装されていない気がするのですが。ワードサラダや自動投稿などブログを使ったスパムがまだまだ全盛の日本のSEOですが、この辺の技術が日本語でも進化してくると、スパム的な手法は今より通用しなくなってくるのでしょうか。 — SEO Japan
Page Top

投稿ナビゲーション