新しいページランクの特許はページランクの何を変える?

ページランクといえばSEOに少しでも携わった人であれば最初に知るSEO用語の一つであり、(かつては?)誰もが一度は通る戦いであり、検索エンジンを革命的に変えたGoogleによるリンク評価による検索ランキングのベース技術です。ページランクの数値自体は指標としては現在は余り意味をなすものでもありませんし、この記事この記事に書かれていることを知っておく程度で十分、Gooogle自身も数年前からページランクは意味が無いと公言しています。しかし何故か2010年になって新しいページランクに関わるような特許がGoogleから申請され、最近受理されていたというニュースがSEO by the Seaが見つけ、さっそく解析してくれましたのでその気になる中身を紹介します。本当にページランクは意味がない指標なのか?その謎に迫ります。 — SEO Japan

判事が裁判所の見解を作成する際、判決以外の情報も含めることが多い。通常は現行の法律の分析、法律の状況、そして、最終的な判決を下した経緯が綴られる。このような判決文には、当該の訴訟の結果には必ずしも大きな影響を与えていない問題に対する裁判所の見解が含まれていることがあり、この見解は「傍論」と呼ばれる。

特許は複数のセクションに分類されている。最も重要なセクションは、請求範囲であり、特許の審査官は調査を行い、付与するべきかどうかを決定する上でこのセクションに注目する。また、特許には特許で紹介されているテクノロジーが実装される仕組みをより豊かに、そして、より詳しく説明する記述のセクションもある(“~可能性がる”を強調)。この記述セクションには、特許の請求範囲には反映されていない資料が含まれることがよくあり、そして、このような記述のセクションの多くは、裁判所の見解において時折提示される傍論と同じような存在である。

本日、スタンフォード大学にデータベース内の文書のスコアリングと言う名称の2点の特許が新たに付与された。どちらも2010年1月19日に米国特許商標局に申請されていた。この2点の特許はスタンフォード大学に帰属し、ローレンス・ペイジ氏が発明者に名を連ねており、同大学に帰属するページランクに焦点を絞った以下の特許の続きと記されている:

過去のページランクの請求

新しい特許の請求項目は、過去の特許に比べ、ページランクの非常に興味深い点をより分かりやすく説明していると言える。

この特許の新しいバージョンの記述のセクションと過去のバージョンの記述のセクションを比較すると、実質的には同じであり、違いと言っても、1998年に申請された特許と新しい特許の形式上の違い、そして、1つ目の特許と新しい2点の特許、そして、2001年と2004年に申請された特許において若干異なる段落が幾つか見られる程度である。

主な違いは請求範囲のセクションに見られる。1998年の特許は、今回の特許の記述セクションで言及されているトピックの多くを取り上げている。例えば、この特許には次の請求範囲が記載されている:

4. 請求1のメソッドは以下を含む:

リンクを張るそれぞれの文書に対する重み付けの要素を特定する。重み付けの要素はURL、ホスト、ドメイン、作者、機関、または1つもしくは複数のリンクを張る文書の前回の更新時期に左右される。

1つまたは複数のリンクを張る文書のそれぞれのスコアを特定した重み付けの要素を基に調節する。

2001年の特許は、記述項目ではあまり強調していない2点の簡潔なパラグラフの請求範囲のセクションを用意している。一方、2004年の特許の請求範囲は、1つ目の特許のように異なる重み付けの要素に注目することなく、ページランクが計算される仕組みをより具体的に取り上げている。

新しいページンランクの請求

新しいページランクの特許を次に挙げていく:

この新しい特許の請求のセクションには、過去の特許では記述セクションでは言及されているものの、請求のセクションには記載されていない点が幾つか掲載されている:

ページランクの個人的なバイアス – 誰かがブックマークしたウェブページ、もしくはホームページと示唆したウェブページに関連するスコアは、ページンランクにパーソナライズドしたアプローチを適用する際は、当該のユーザーが検索を行う時、当該のユーザーに対して高く評価される可能性がある。

同じドメイン上のリンク – このようなリンクは、ページに対するスコアが計算される際は無視されることもあり得る。

同じサーバー上のリンク – このようなリンクは、ページに対するスコアを計算する上で無視される、もしくは、異なるサーバーからのリンクよりも低く評価される可能性がある。

地理的な場所 – 多数の地理的な場所に存在する異なる作者によって作成された他のページからの被リンクを持つページに対するランクは上位に押し上げられると推測される。

ホームページからのリンク – ドメインのルートページ、もしくはホームページからのリンクは、その他のページからのリンクよりも重みが加えられる可能性がある。

変更された日がより浅いページからのリンク – 更新された日がより浅いページからのリンクは、更新されていないページからのリンクよりも重要視される可能性がある。

リンク内のテキスト – ページへ向かうリンク内のテキストが、当該のページを見つけるために用いられたクエリとマッチする、もしくは関連する場合、当該のページに対するスコアはより高く設定されると推測される。

リンクの隣のテキスト – ページに向かうリンクの隣のテキストが、当該のページを見つけるために用いられたクエリとマッチする、もしくは関連する場合、当該のページに対するスコアはより高く設定されると推測される。

請求範囲で見過ごされていたランキングシグナル

この特許は、これらの特許の請求のセクションでまだ取り上げられているとは思えない一部の問題を指摘している。ただし、グーグルが利用しているかどうかには関係ない。それでは当該の問題を挙げていく:

リンクの文書内での総体的な重要性 – 文書の上部に近い目立つリンクはより多くの重みが加えられる可能性がある。

実際の利用データ – この特許は、実際の利用データが利用可能な場合、“より正確な、もしくは、より包括的な構図”を提供するためにデータが用いられることもあり得ると指摘している。このデータが利用される仕組みに関する情報は、新旧のページランクの特許には見当たらない。

収穫

グーグルのリーズナブルサーファー(日本語)の特許は、これらの特許の請求範囲のセクションでは取り上げられていない問題の一部に言及している。リンクに関連する特徴(フォントのサイズや色やタイプ、リンクの実際のテキスト、リンクのテキストが営利目的かどうか、イメージリンクの割合等)、リンクが表示されているページの特徴、リンクが向かうページに関連する特徴、そして、これらのリンクとページに関連する利用データに注目することで、ページ上のリンクの“総体的な重要性”を見極める件もその一つである。

グーグルは1点目の特許においてページランクを恒久的に利用するライセンス、そして、2011年に期限が設定された独占的なライセンスを持っていた。スタンフォード大学とグーグルはこの期限を巡って交渉を行った可能性はある。先日、ワシントンステート大学の研究者は、ページランクと多くの共通点を持つアルゴリズムを適用し、化学的な挙動を理解する試みを行っていたが、これがスタンフォード大学とグーグルの独占契約が失効したことを示唆しているとは言い切れない。

これらの新しい特許を、スタンフォードとグーグルが契約を延長し、ページランクを両者で維持する決定を下した証拠と見ることも出来る。現在、ローレンス・ペイジ氏は、自分の名前をつけたアルゴリズムの開発に取り組んでいたスタンフォード大学の学生ではない。

新しい2点の特許の請求範囲に記載されている要素の多くは、最初の特許の請求のセクションで大まかに取り上げてられており、また、新しい特許は利用をさらに明確にするために申請された可能性もある。グーグルはグーグルを立ち上げた当初からこれらの特許に記載されているテクノロジーを使ってきたとも考えられる。また、その時代から進歩している可能性は高い。グーグルのインサイドサーチブログに先日投稿されたメッセージで、グーグルは数年間利用していたリンク分析のメソッドから卒業しつつある点を認め、また、私が前回投稿した「変化した可能性のある12点のリンク分析メソッド」にはその候補のメソッドが幾つか含まれている。

また、新しい特許の請求のセクションで同じドメインや同じサーバー上のページ同士のリンクが、ページランクの計算において、過小評価もしくは無視される可能性があると綴られているとしても、必ず実際に過小評価もしくは無視される、あるいは、今後、過小評価もしくは無視されることを裏付けているわけではない。しかし、グーグルがページの格付けを行う仕組みに変更を加えることで、より質の高い検索結果を提供することが出来ると考えれば、ページランクが同じドメインのリンクにもたらす量に制限をかける等の取り組みを実施することもあり得る。

また、グーグルは、パーソナライゼーション、アンカーテキストの重みと関連性、異なるドメインの共通のオーナーシップ等に関して、グーグルがその他のリンク分析のアプローチを検索結果の格付けに異なる方法で用いる仕組みを描く特許を他にも公開している。そして、これらの特許で列挙されているメソッドが、グーグルが上述した要素の類を利用する仕組みに取って代わっていても何らおかしくはない。

新しいページランクは過去のページランクと異なるのだろうか?分かりやすくなっただけなのだろうか?あるいは、これらの続きの新しい特許の請求範囲を更新および拡大する取り組みは、グーグルのリンク分析に対するアプローチを変えるきっかけになったと言えるのだろうか?


この記事は、SEO by the Seaに掲載された「The New PageRank, Same as the Old PageRank?」を翻訳した内容です。

最初に特許を取得した以降、Googleが向上させてきた様々なリンク評価の要素を追加整理して特許を取得し直しただけのような気もしますが、しかしかなり面白い内容です。

ページランクのパーソナライズド化、同じドメインやサーバー上のリンクは無視しうる、ホームページからのリンクは効果的、多数のロケーションからのリンクが効果的かも、アンカーテキストの隣のテキストは重要、、、。

これまでSEOで経験則や何となくの感覚から実践されてきたSEO手法やSEOに関する都市伝説の一部を肯定するような内容も見えますね。って、あくまで特許であってどこまで実際に利用しているかは別問題ですが。

記事にもあるように、現在のGoogleはリーズナブルサーファーモデルを活用しここに書かれているような内容からさらに進んだリンクやページ分析をしているわけですが。。。いずれにしてもページランク対策に四苦八苦してきた過去を持つオールドSEOな私には面白く読める記事でした。 — SEO Japan


アイオイクスではSEOを軸としたWebコンサルティングサービスを提供しています。

いわゆるSEOの型に沿った施策ではなく、お客様の事業やWebサイトの構成を踏まえた最適な施策のご提案を重要視しています。SEOにお困りの際はぜひご相談ください。

→SEOコンサルティング サービスページ

アイオイクスでは一緒に働く仲間を募集しています

アイオイクスのWebコンサルティング事業部では、「一緒に挑戦し、成功の物語を共有する」という理想像を掲げ、本質的な取り組みを推進しています。私たちと汎用性の高いスキルを突き詰め、自由に仕事をしていきませんか。

メールマガジンの登録はこちら

SEOに関連する記事の更新やセミナー情報をお届けします。

Page Top

投稿ナビゲーション