検索エンジンが考慮する重要性とは?

進化し続ける検索エンジンのアルゴリズム、関連性や重要性が大事だとはいわれますが、今回はその重要性についてSEO by the Seaが考えてみた記事を。いつもの特許分析よりは裁判の陪審員制度と検索エンジンが考える重要性を考えたユニークなアプローチの記事を。 — SEO Japan

検索エンジンは、関連性、そして、動的な特徴に注目し、ウェブページの格付けを行う。しかし、ページの格付けおよび順序付けの仕組みを見る際に考慮するべき重要な要素がもう1つある。

重要性および証拠

証拠が民事裁判または刑事裁判で提出されると、判事は陪審員に与える前に、または与えることを考える前に、証拠の関連性を考慮するだけでなく、証拠の重要度を判断する。

例えば、弁護人が、殺人容疑がかけられた30歳の被告を弁護する際に、被告が良い人物である点を証明したと仮定する。 これは被告に関する証言であり関連性がある。この証言は、事実を理解しようとする人達にとって、役に立つ情報を与える。しかし、証言を求められた人物が被告の幼稚園時代の先生であったらどうだろうか?さらに、その先生が、被告はいつも時間通りに昼寝をする、他の子友達と仲良く遊ぶ、そして、決して怒らない子供であったと証言した場合はどうだろうか?関連してはいるものの、この証言は重要ではない。約25年前の被告に関する証言は重要ではないのだ。

また、判事は証拠が裁判で採用するほど重要かどうかを決定するため、その他の要素に注目することもある。その一つが訴訟経済と言われるものだ。例えば、先程の殺人事件の被告が、ヤンキースタジアムを訪れた5万人のベースボールファンの目の前で事件を起こしたと仮定しよう。観客のほとんどが殺害現場を目的していたことになる。ファンの証言は関連性があり、そして、重要ではあるが、ほとんど同じ証言をするなら、これだけ大勢の人々に証言をさせるのは、法廷にとって得策とは言えない。

また、重要な証拠が偏見をもたらすかどうかも判事は考慮する可能性がある。 例えば、検察官が、被告が速度制限を16キロオーバーして車を運転し、犯行の1週間前に出頭を言い渡されていた証拠を持ちだしたとする。この事実は被告に関連しており、また、速度違反自体は犯罪ではあるものの、被告が殺人を行ったかどうかを示すものではなく、また、陪審員に偏見を抱かせてしまう可能性がある。被告が法律を完全に無視する人物だと言うイメージを陪審員に与えると、殺人に関する事実を判断する上で偏見が生じてしまう。

裁判における証拠は、関連性があり、重要でなければならないが、法的な手続きに進む前に、裁判官による一定の基準をクリアしなければならない。

重要性と検索エンジン

検索エンジンもまたクエリに対して関連性があり、重要な結果を返す試みを行っている。この判断を行う上で、クエリに依存するシグナル、そして、クエリに依存しないシグナルを検討することがある。クエリに依存するシグナルは、特定のページに対するランキングスコアを決める際にクエリ自体の情報を含む。一方、ページに対するスコアを判断する上で特定のクエリを考慮しないのが、クエリに依存しないシグナルである。 この2つのタイプのスコアは、最終的なランキングスコアを確定する上で、組み合わされることがある。

クエリに依存しないランキングシグナルの一つがページランク(日本語)である。ページランクは、ページに向かうリンクの質と量に注目し、当該のページの重要性を特定する。グーグルのホームページ等、一部のページは非常に高いページランクのスコアを得ているものの、あまり関連性のないクエリに対しては、上位にランクインする上でほとんど役に立たない。

ページのスコアを決定する上で重要度が鍵を握る分野の一つが、新鮮さである。 [microsoft windows]をグーグルで検索すると、ウィンドウズ 3.1、ウィンドウズ 95、ウィンドウズ XP、そして、その他の過去のOSに関するページが表示される。結果の中には、このトピックに関する一般的なページもあれば、ウィンドウズ 8に関するページも幾つかリストアップされている。殺人事件の裁判の例の幼稚園の先生による人物像の証言と同じように、このような結果はあまり重要ではない。

グーグルおよびマイクロソフトが申請した多くの特許は、静的なランキングやページのスコアに対する品質スコアを検討するウェブページの特徴について説明している。ワードの数、読解レベル、ページのレイアウト、ページ上の広告の位置、プライバシーポリシーの有無、グラマーの質等、ページで見つかる様々な特徴に関連していると推測される。また、ページがどのぐらいの頻度で新しいリンクを得ているのか、ページのコンテンツがどれぐらいの頻度で変化しているか等にも検索エンジンが注目している可能性がある。昨年公表されたマイクロソフトの論文は、ページの信頼性が検索結果の格付けを再び行う上で用いられる仕組みに言及している。

教訓

検索結果でのページやその他のアイテム(動画、イメージ、ニュース、書籍、マップ)の格付けは、クエリに対しての関連度、そして、クエリに対する関連性の定義をある程度ベースにして行われると思われる。また、格付けは、関連性と組みわせ、結果の重要性を考慮して行われる可能性がある。

パーソナライズドされたページランク、または、ユーザーがソーシャルネットワークに投稿し、その他のユーザーと共有したトピックに基づく評価スコアをユーザーに与えるソーシャル評価ランク等、関連性と重要性を組み合わせるタイプのランキングシグナルが存在する。因みに、この評価スコアは、ソーシャル検索結果、そして、今後においては恐らくウェブ検索結果におけるページの格付けにおいても大事な役割を果たすものと思われる。


この記事は、SEO by the Seaに掲載された「On Materiality and Search Engines」を翻訳した内容です。

重要性を裁判と比較して考えたのは興味深かったです。検索エンジンにとっての陪審員はリンクと言い換えることができるかもしれません。従来は数を揃えればどうにかなったのが、徐々に質や関連度まで求められるようになり、10本の関係ないリンクより1本の質・関連度の高いリンクがより評価されるようになってきています。まだまだ裁判の陪審員に比べれば操作されてしまうものでもありますが、リンクだけではもちろんなく、ページの内容や情報の鮮度他様々の要素をアルゴリズムに取り入れ重要性を判断するべき進化している検索エンジンです。

SEOに詳しい人には余り新しい発見はないかもしれませんが、SEOに詳しくない人に検索エンジンの評価基準を説明する際に、日本でも最近導入されただけに、裁判の陪審員制度はわかりやすいかもしれません。 — SEO Japan [G+]

Page Top

投稿ナビゲーション