やりがちな重複コンテンツとは?主な対処方法とチェックツールについて
突然、インターネット検索で順位が下がりました。
重複コンテンツではないでしょうか?
サイト内に類似度の高いページがあるのですが、
ペナルティなどを受けますか?
重複コンテンツとはタイトルやページの内容が同じか、よく似たコンテンツのことです。 同じページが複数のURLで生成される、似たようなページが自動的に作られる場合には、URLの正規化をしてGoogleにどのページを優先させるのかを指定します。
何も意識をしていなくてもWebサイトやブログのテーマによって重複コンテンツになっていることがあります。今回は、重複コンテンツの対処方法や確認ツールなどをご紹介します。
目次
重複コンテンツとは
重複コンテンツとは、「タイトルやテキストの内容が他のページと重複していること」を指します。
- 同一のサイト内で同じようなページがある
- 他のサイトと同じようなページがある
- 同じページで別のURLがある
- 同じURLでファイル名、スラッシュ、パラメータなどがある
同一サイト内で同じようなページが複数あると、評価が分散されることでいずれかのページの順位が下がる可能性もあるので注意します。
コンテンツにおける注意点
Googleのガイドラインには、重複コンテンツの例や基礎的な注意事項が書かれているので、以下にまとめておきます。
>>Googleのガイドラインより
重複コンテンツの作成を避ける
定型文の繰り返しをできるだけ少なくする: たとえば、著作権に関する長い説明をすべてのページの下部に表示する代わりに、短い要約文を組み込んで詳細情報のページにリンクするようにします。また、パラメータ処理ツールを使用して、URL パラメータの処理方法を Google に指定することもできます。
スタブを公開しないようにする: ユーザーは「空」のページが表示されることを好みません。そのため、可能な限りプレースホルダを使用しないでください。たとえば、実際のコンテンツがまだ存在しないページは公開しません。プレースホルダ ページを作成した場合は
noindex
メタタグを使用して、これらのページがインデックスに登録されないようにしてください。
コンテンツ管理システムについて理解する: コンテンツがウェブサイトで表示される仕組みをよく理解しておきます。ブログやフォーラムなどのシステムでは、同じコンテンツが複数のフォーマットで表示されることがよくあります。たとえば、ブログのエントリは、ブログのホームページ、アーカイブ ページ、同じラベルを持つ他のエントリのページに表示されることがあります。
Googleガイドライン
類似するコンテンツをできるだけ少なくする: 類似するページが多数存在する場合は、各ページに内容を追加するか、または 1 つにまとめます。たとえば、旅行サイトで 2 つの都市を別々のページで紹介しているが、ページ内の情報は同じである場合は、両方の都市を紹介する 1 つのページにまとめるか、各ページに内容を追加して、それぞれの都市に関する独自のコンテンツを含めます。
重複コンテンツが生成される場合
あまり意識していないことが多いかもしれませんが、不動産会社などでは、「地名や駅名」「間取り」や「設備」「面積」「築年数」など条件検索だできるので、同じ部屋でも検索結果のページが複数作られます。
ECサイトなどでは、「ブランド別」「価格別」「商品別」などから、同一コンテンツ(同一商品など)が複数のページ(URL)として存在します。
ホームページの運営上、似たようなページが多くなる場合には、対処しておくことをおすすめします。
不動産会社のブログ作成・重複コンテンツについてはこちらの記事もよく読まれています。
自社サイトと他社サイトとの間の重複コンテンツと、自サイト内での重複コンテンツのように分けて考えるとわかりやすいかもしれません。ポータルサイトに自社のページやコンテンツを表示させる際にも、あらかじめ設定をしておくことがあります。
〜重複コンテンツの例〜
- 他サイトへコンテンツ提供をしている
- 自サイトのコンテンツを他サイトがコピーしている
- 他サイトのコンテンツを自サイトがコピーしている
自サイト⇄自サイト間において
- 自サイト内に似たようなページが複数ある
- 閲覧用ページと印刷用ページが別にある
- PCページとモバイル用ページが別にある
- 自動的にURLが生成されてしまっている
重複コンテンツの対処法
一般的な対処法としては、URLの正規化をしていきます。301リダイレクトやcanonical設定です。
ページの評価を分散させないために リダイレクトによって正しいページに転送させる、canonical設定によって検索エンジンに正規ページを伝える といったやり方です。
なお、Webサイトの仕様により、異なるページで同一の見出しやdescriptionが表示される場合、検索エンジンから低評価と判断され不利益を受けることがあります。見出しとdescriptionが重複していないか注意してください。
重複コンテンツの対処法
・re=”canonical” リンクタグを使用する
・rel=”canonical” HTTP ヘッダーを使用する
・サイトマップを使用する リンク ・廃止する URL に 301 リダイレクトを使用する
Google Search Console
類似テキスト・画像のチェックツール
ここでは、無料でチェックできるツールをご紹介しておきますね。テキストの類似度などをチェックできます。
テキストチェックツール:CopyContentDetector
「CopyContentDetector」は、インターネット上に似ている文章がないか、ページ内のテキストの一致率などを判定するツールです。
サイトチェックツール:sujiko.jp
「sujiko.jp」は、比較したいURLを入力し、ミラーサイトやコピーサイトをチェックできるツールです。
画像チェックツール:DupliChecker
「DupliChecker 」は、重複画像や類似画像を見つけるためのツールです。①画像をドロップしてチェック②URLを貼り付けてチェック③キーワードで画像を検索してチェックができます。
ペナルティや品質にも注意を!
今回は重複コンテンツについて紹介しました。
「検索順位が圏外に飛ばされる」「検索結果に表示されなくなった」という場合には、ペナルティを受けていることもあるので、ペナルティの確認が必要です。
Webサイトリニューアル時に既存のLPなどの重要なページをリダイレクトさせる、自動で生成されてしまったURLには適切な設定を行うなどのポイントを抑えておきましょう。
パラメータを使ってアクセス解析を行う場合にはcanonical設定をする、不動産の物件検索で0件と表示される一覧ページはインデックスさせないようにする、なども必要ですね。
リダイレクトやNON-INDEXの設定は業種別に特徴があるので、同業他社のWebサイトをチェックして常にアンテナを張っておきましょう。