Search Consoleで「低品質コンテンツ」を見つける方法と対処方法

こんにちは、SEOコンサルタントの谷藤(@go_tanifuji)です。

今回のテーマは「低品質コンテンツ」です。

低品質コンテンツに対してとても神経質になられているお客様が多く、「このコンテンツは低品質かもしれないので、ペナルティを受ける可能性がありますか?」という質問をよく受けます。

その際に回答する内容をまとめましたので、ぜひ参考にしてみてください。

*この記事は2020年10月13日に「アイオイクスの社員ブログ」に掲載されたものをブラシュアップした内容になります。

低品質コンテンツとは(定義)

SEOにおける低品質コンテンツとは、下記の2つを指します。

  1. ユーザーにとって価値のないコンテンツ
  2. Googleのガイドライン違反に当たるコンテンツ

とあるページが低品質とみなされた場合、Googleはそのページをインデックスせず、結果として検索結果に表示されないことになります。

しかし、すべての低品質コンテンツに改善の必要があるかというと、そうではありません。

●参考:質の低いコンテンツがサイトのランキングに与える影響 | Google 検索セントラル | ドキュメント | Google Developers

低品質コンテンツの対応が必要なサイト

対応が必要な場合は下記の2つです。

  1. サイトの大部分が低品質コンテンツの場合
  2. Googleのガイドラインを違反しているコンテンツの場合

そのため低品質コンテンツが数ページしかなく、ガイドライン違反をしていないサイトに関しては対応の必要はありません。

低品質コンテンツが与えるSEOの悪影響

下記の2つのリスクがあります。

  1. パンダアップデートを受けるリスク
  2. Googleから手動対策(ペナルティ)を受けるリスク

パンダアップデートの影響を受けるリスク

パンダアップデートとは2011年に導入された低品質なサイトの順位を下げるアルゴリズムのことです。

このアルゴリズムの変更では、低品質なサイトの掲載順位を下げ、同時に、良質なサイトの掲載順位をより適切に評価します。

●引用元:Google 検索が、高品質なサイトをよりよく評価するようになりました | Google 検索セントラル ブログ | Google Developers

低品質なサイトとは、低品質コンテンツがサイトの大部分を占めているものを指します。

Googleから手動対策(ペナルティ)を受けるリスク

手動対策(ペナルティ)とは、Googleが目視でガイドライン違反をしていないかチェックをし、違反している場合は手動で対策を施すものです。

その際には下記のようなメッセージがGoogle Search Consoleに送られてきます。

手動ペナルティ

なお、手動対策は通称ペナルティと呼ばれていますが、Google自身はペナルティという言葉を使用していません。

低品質コンテンツをなくすことによるSEOの好影響

下記の2つが期待できます。

  1. クロール効率の改善
  2. サイト全体の品質の改善

クロール効率の改善

低品質コンテンツがサイトの多くを占めている場合、無駄なクロールが発生しています。

そのため低品質コンテンツを削除することで、重要なページへクロールされやすくなり、クロールの効率が改善されます。

サイト全体の品質の改善

低品質コンテンツがサイトの多くを占めている場合、サイト自体が低品質だと判断されてしまいます。

そのため低品質コンテンツを減らし、高品質なコンテンツの割合を増やすことで、サイト全体の品質を改善することができます。

低品質とみなされているコンテンツを見つけるには、Google Search Consoleを活用します。

クロール済み-インデックス未登録

低品質コンテンツの可能性があるページは「カバレッジ > 除外 > クロール済み-インデックス未登録」に表示されます。

クロール済み - インデックス未登録

●参考:ウェブマスター オフィスアワー 2018 年 12 月 17 日

●参考:「クロール済み – インデックス未登録」とSearchConsoleで表示されたときの対処方法

低品質コンテンツには大きく分けて4種類がある

低品質コンテンツの種類に対して、それぞれどのような対応が必要か解説していきます。

何をもって低品質コンテンツかというのは人によって意見が分かれますが、Googleが公式に明言しているのは主に下記の4つです。

  1. 内容の薄いコンテンツ
  2. 無断複製されたコンテンツ
  3. 自動生成されたコンテンツ
  4. コメントスパムがあるコンテンツ

●参考:質の低いコンテンツがサイトのランキングに与える影響 | Google 検索セントラル | ドキュメント | Google Developers

●参考:コメントスパムを防止する方法 | Google 検索セントラル | ドキュメント | Google Developers

①内容の薄いコンテンツ

ありきたりの内容で、ユーザーに有益な情報を与えていないコンテンツを指します。

私が担当したサイトの例ですと、社員が持ち回りで「今日の一言」と題して「石の上にも三年!」というように一言書くという企画がありました。

これらのページはことごとく「クロール済み-インデックス未登録」に表示され続けており、明らかに低品質コンテンツとしてGoogleに扱われていました。

対処法は以下の3つです。

  1. 高品質に改善
  2. 削除
  3. noindexを設定

高品質に改善

ユーザーに有益な情報を与えるコンテンツを追加することにより、高品質化させるという対応です。

例えばそのテーマの専門家に監修に入ってもらうことで、高品質化することができます。

削除

高品質化できない場合は、削除することを推奨します。

noindexを設定

高品質化も削除もできない場合は、noindexを設定します。

どのような場合に行うかというと、サイトのテーマとはまったく関係のない「社長ブログ」がよくある事例です。

社長ブログ

サイトのテーマに関係がないので高品質化が難しく、「社長のブログなので削除はちょっと・・・」ということで削除もできないというケースがよくあります。

そういうケースでは、そっとnoindexを設定することを推奨しています。

②無断複製されたコンテンツ

無断で転載している場合はGoogleの品質ガイドライン違反にあたります。

無断複製されたコンテンツの例としては、次のようなものが挙げられます。

・他のサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト

・他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト

・何らかの独自の体系付けやユーザーへの利便性を提供することなく他のサイトからのコンテンツ フィードをそのまま掲載しているサイト

・ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだだけのサイト

●引用元:無断複製されたコンテンツ | Google 検索セントラル | ドキュメント | Google Developers

以前流行っていたキュレーションサイトもこれにあたります。

しかし、当時のキュレーションサイトは検索意図の網羅性が評価されてしまい、上位表示されて問題になっていました。

それに対し2017年2月にGoogleはアルゴリズムの変更を行い、キュレーションサイトの評価を下げました。

ウェブサイトの品質の評価方法に改善を加えました。

今回のアップデートにより、ユーザーに有用で信頼できる情報を提供することよりも、検索結果のより上位に自ページを表示させることに主眼を置く、品質の低いサイトの順位が下がります。

その結果、オリジナルで有用なコンテンツを持つ高品質なサイトが、より上位に表示されるようになります。

●引用元:日本語検索の品質向上にむけて | Google 検索セントラル ブログ | Google Developers

他のサイトからの転載を行うのであれば、転載の許可をもらったうえで、下記の2つの対処方法を検討しましょう。

  1. 高品質に改善
  2. canonicalの設定

高品質に改善

転載するだけでなく、独自の見解を加えることで付加価値を与えて高品質化させます。

canonicalの設定

高品質化が難しい時はcanonicalの設定を行います。

転載元のページに向けてcanonicalを設定し、自社ページが非正規ページであることをGoogleに伝えます。

「ドメインをまたいでcanonicalを設定できるんですか?」と質問を受けることがありますが、Googleはサポートしています。

we’re announcing our support of the cross-domain rel=”canonical” link element.

クロスドメインのcanonical設定をサポートすることを発表します。

●引用元:Official Google Webmaster Central Blog: Handling legitimate cross-domain content duplication

③自動生成されたコンテンツ

機械的に作られたコンテンツのことで、これもGoogleの品質ガイドライン違反にあたります。

自動的に生成されたコンテンツ(「自動生成コンテンツ」)とは、プログラムによって生成されたコンテンツのことです。

Google では、検索ランキングを操作することを目的としている、ユーザーの役に立たないコンテンツに対し、措置を取ることがあります。

●引用元:自動生成されたコンテンツ | ドキュメント | Google Developers

昔のGoogleはページ数が多いサイトを評価していたため、記事を量産するための自動生成ツールが流行りました。

その記事にはキーワードは入っていますが、文章としてなりたっておらず、通称「ワードサラダ」といわれていました。

対処法としての選択肢は1つで、コンテンツを自動生成せずに人が書くことです。

ユーザーに付加価値を与えるコンテンツ制作に路線を切り替えていきましょう。

④コメントスパムがあるコンテンツ

ブログなどにあるコメント機能に、広告のようなコメントや関係のないサイトへ誘導するリンクがあるものはスパム行為と判断されます。

そしてそのページが低品質コンテンツとGoogleに認識されるとランキングに悪影響を及ぼすことがあります。

コメントを活用すれば、コミュニティを形成し、読者を獲得することができます。

しかし残念なことに、スパマーなどに悪用されることも頻繁にあります。

スパマーは多くの場合、スクリプトやその他のソフトウェアを使用してスパムを生成し投稿します。

広告のようなコメントや関係のないサイトへのランダムリンクはコメントスパムです。

この種類のスパムは次のような悪影響をサイトに及ぼす可能性があります。

・ウェブサイトの一部に低品質なコンテンツがあると、サイト全体のランキングに影響を与えることがあります。

●引用元:コメントスパムを防止する方法 | Google 検索セントラル | ドキュメント | Google Developers

そのため下記のようなコメントスパム対策を行う必要があります。

  1. コメントを承認制にする
  2. スパム対策ツールを導入する
  3. リンクにnofollow属性を設定する

コメントを承認制にする

コメントを即時に公開するのではなく、管理者がスパムコメントではないことを確認してから承認する方法です。

Word Pressなど多くのCMSにデフォルトである機能です。

ただ、コメントが多い場合は管理者の負担が増えてしまうのがデメリットです。

スパム対策ツールを導入する

ユーザーに対し、悪意のあるスパムスクリプトではない本物の人間であることを証明するよう求めるツールです。

下記はGoogleが無料で提供する「reCAPTCHA」簡単にサイトに実装できます。

 reCAPTCHA

●参考:reCAPTCHA

リンクにnofollow属性を設定する

下記のようにリンクにnofollow属性を設定すると、リンク先を評価しないことをGoogleに伝えることができます。

<a href=”http://www.example.com/” rel=”nofollow“>

またugc属性でも代替可能です。

<a href=”http://www.example.com/” rel=”ugc“>

これによりユーザーが作成したリンクであることをGoogleに伝えることができます。

低品質とは限らないコンテンツ

下記の5つは一概に低品質コンテンツといえません。

  1. 文字数の少ないページ
  2. 滞在時間が短いページ
  3. 検索トラフィックが少ないページ
  4. フィード
  5. カテゴリーページ

①文字数の少ないページ

例えば「多幸とは」と検索すると、1位にランキングしているのはgoo国語辞書で、メインコンテンツは「非常にしあわせなこと。また、そのさま。」の1行です。

「多幸とは」と検索する人の検索意図は、言葉の意味を知りたいだけですので、1行だけでも十分なのです。

そのため文字数が少なくても、「クロール済み – インデックス未登録」に表示されておらず、ユーザーの検索意図に応えているのであれば低品質コンテンツではありません。

②滞在時間が短いページ

Googleアナリティスクで滞在時間が短いページが低品質コンテンツになっているという話をよく聞きます。

しかしこれは一概に低品質コンテンツとはいえません。

例えば①で上げた文字数の少ないページは必然的に滞在時間も短くなるためです。

そのため滞在時間は文字数にあったものかどうかという観点でみなければいけません。

③トラフィックが少ないページ

お客様からよく「トラフィック(検索流入数)が少ないページは、低品質コンテンツだから削除した方がいいですよね?」という質問を受けます。

これは誤りで、Googleのジョン・ミューラー氏は「トラフィックが少ないからという理由だけで低品質コンテンツと判断しない方がいい」と述べています。

気を付けることがひとつあるとしたら、検索トラフィックが少ないという理由からそのコンテンツが悪いに違いないと考え、削除しようとすることだ。

たいした検索トラフィックがなかったとしてもまったく問題ないときもある。検索するユーザーが単に少ないだけかもしれない。

(中略)

昔の天気予報のコンテンツを残しておいたとして、10年後にだれかが調査目的で見つけて役に立ててもらえるかもしれない。

10年前の天気予報というのは、もはや内容の薄いコンテンツとも言えそうだが、固有の情報を持っているし、もし存在しなければ検索で発見してもらえなかっただろう。

●引用元:低品質コンテンツがわずかに存在していても検索では問題にならない。検索トラフィックがないことは価値がないことを意味しない | 海外SEO情報ブログ

そのため「クロール済み – インデックス未登録」に表示されておらず、誰かの役に立つコンテンツであれば低品質ではないのです。

④フィード

フィードはいわゆるRSSフィードのことで、RSSリーダーに登録するときに使われる仕組みです。

Googleは下記のようにフィードを推奨しています。

Google では、最適なクロールを行うために、XML サイトマップと RSS/Atom フィードの両方を使用することをおすすめしています。

●引用元:XML サイトマップと RSS/Atom フィードのベストプラクティス | Google 検索セントラル ブログ | Google Developers

また、世界中で使用されているWordPressにデフォルトで設定されているので、仮にフィードを低品質コンテンツとGoogleが見なした場合、WordPressで作成されているサイトは軒並み順位を下げるはずです。

そのような現象は起きていないことから、Googleはフィードを低品質コンテンツと見なしていないといえます。

しかし、下記のようにGoogle Search Consoleの「クロール済み – インデックス未登録」にフィードが大量に出ていると心配されるお客様もいらっしゃいます。

feed

また表示できるURLが1,000件までのため、フィードが邪魔して他のURLが見れないという場合もあります。

そういう時は、HTTPヘッダーに 「X-Robots-Tag: noindex」を追加すればフィードにnoindexが設定され、「クロール済み – インデックス未登録」から「noindex タグによって除外されました」に移動します。

 X-Robots-Tag

●参考:robots メタタグの指定 | Google 検索セントラル | ドキュメント | Google Developers

⑤カテゴリーページ

カテゴリーページは重複コンテンツなので低品質コンテンツになるという話をよく聞きます。

しかしこれは誤りです。

カテゴリーページは関連する記事を束ねているページですので、個々の記事よりもSEOに強いページになります。
例えばGoogleで「ポロシャツ」と検索すると、1位が「ZOZOTOWNのカテゴリページ」です。

カテゴリーページの例

よくあるミスとして、カテゴリーページにnoindexを入れてしまうケースです。

WordPressのプラグインである「All In One SEO Pack」を入れているサイトでよく見かけます。

詳しくは「All In One SEO Pack」でよくある、SEOの致命的なミスを参考にして下さい。

タグページも同様の理由でSEOに強いページですので、noindexを入れないようにしましょう。

最近の傾向

Googleは「サイト運営者」の専門性、権威性、信頼性(E-A-T)を重要視する傾向にあります。

Low quality pages often lack an appropriate level of E-A-T for the purpose of the page.

低品質なページはしばしば、そのページの目的に対してふさわしいレベルの専門性、権威性、信頼性(E-A-T)が欠けています。

Understanding who is responsible for a website is a critical part of assessing E-A-T for most types of websites. High
quality pages should have clear information about the website so that users feel comfortable trusting the site

ほとんどのウェブサイトにとって、誰がウェブサイトの責任者であるかがわかることが、ウェブサイトの専門性、権威性、信頼性(E-A-T)を評価するために決定的な部分を占めています。

●引用元:General Guidelines

まとめ

低品質コンテンツの特定方法と、その対処法について解説してきました。

低品質コンテンツに関しては様々な噂があり、判断に迷う方も多いと思います。

この記事を参考に、Search Consoleを用いて正しい対応をしていただければ幸いです。

もっとSearch Consoleを使いこなしたいという方は、3月31日(木)にSearch Consoleのセミナーを行いますので、ぜひ参加して下さい。

お申し込みは下記からお願いいたします。

>>「【再演】Google Search Console 実践セミナー ~プロが使用しているノウハウ10選~

では、また次の記事でお会いしましょう!

Page Top

投稿ナビゲーション