読者です 読者をやめる 読者になる 読者になる

SEOカフェ | アクセスと売上UPを目指して

〜 SEOにお悩みの方は是非コーヒーブレイクしてみてください 〜

【サイト内の低品質ページの探し方】site:URL -ディレクトリで徹底チェック

Webマーケティング・SEO・集客
このコンテンツは、架空のキャラクターであるWeb担当担当の如月ゆずが、Web集客の中でも目に見えないSEOを中心にWebマーケティングを学びながら成長していくブログです。

重複ページは低品質評価を受けやすい

 

サイト内で低品質なページってどうやって探すの?

 

耳にイカができるほど嫌(イカ)ってほど聞いてます。

 

重複ページのあぶり出し方はネットでもゴロゴロ載ってるけど

 

低品質なページの探し方が載っていない

 

 

ちなみにここでいう低品質なページとは

 

画像だけのサイトや明らかに「それ(そのページ)いらないでしょ」という内容のページを指しています。

 

画像だけ

 

画像とほんのわずかなテキストだけ

 

こんなページを見つけたらさっさとnoindex処理をするかGoogle Search Consoleから削除しましょう!

 

 

サイトの上位表示に悩んでいるいる方は低品質なページがないか疑ってください。

 

低品質なページはどうやって見つける?

低品質ページは意外と簡単に見つかるんですよ!!

 

 

もはや定番となりましたね、宇野さん。

 

はい、図々しく出させてもらってます。

なんだったらこちらに転職しましょうか?

 

いえ、けっこうです。

 

・・・ぐすん。

 

可愛子ぶってもダメです。

 

分かりました(笑)

「自社サイトの中に低品質ページがあるのかどうか」を知るのはかなり難しいですよね。

 

自分で運営していて低品質なページがまさか存在するとは思っていないですしね。

 

実は意図せず生成されたのを知らずにGoogleにインデックスされてしまうこともけっこうあるんです。

 

へぇ〜

 

WordpressをはじめとするCMSを利用している場合は、注意が必要です。

調べる方法はいくつかありますが、ここでは簡単な方法をご紹介します!

 

1. 「site:URL」で後ろのほうに出てくるページを疑う

site:URLでの検索でインデックスされているページを確認できます。
(※ インデックスしている全てのページではなく一部)

 

表示された検索結果で最も後ろのページを見てみましょう。

 

嘘か真か、site:URLで検索すると低品質ページは後ろのほうに表示されやすいんですね。

 

語弊があるといけないのですが、後ろに表示されるからってそのページが必ず低品質というわけではありません。

 

経験則として画像だけのページややたら少ないテキストページが後ろの表示されやすいなぁと感じているだけです。

 

また、明らかに「このページいらない!」と思ったら該当URL内のタイトル、文章の一部をコピーしておきます。

 

「site:URL "コピーした内容"」で検索すると"コピーした内容"が記述されているページが出現します。

 

内容を吟味してURLだけ異なっていて内容は全く同じだったり、若干違うけどほぼ同じページであれば片方を削除しましょう。

 

2. 「site:URL -ディレクトリ」で特定ディレクトリを除いて検索

これはインデックスページ数がやたら多い時に活用できます。

 

例えば、調べた結果が1,900件のインデックスが少なくともあると分かるサイトがあったとします。

 

 

実際に見てみると

 

 

509/1,900件しか表示されません。

 

ここで「site:URL -ディレクトリ」の出番です。

 

絶対低品質だと思わないページの集まるディレクトリや取り除きたいディレクトリをsite:URLのあとに入力します。

 

categoryディレクトリを取り除きたい場合は

 

「site:URL -category」

 

categoryディレクトリとblogディレクトリを同時に取り除きたい場合は「site:URL -category -blog」とすることで各ディレクトリを取り除いた検索結果になりますよ!
※ URLと-の間は半角スペースを入力してください。

 

3.「site:URL ディレクトリ」で特定ディレクトリを含むページを検索

今度は逆です。

 

特定ディレクトリを除いた中に低品質ページが含まれている可能性もあります。

 

そうした場合は特定ディレクトリ以下のページを表示することもできます。

 

先ほどは、ディレクトリの前に-入力していましたが今回はそちらは入力しません。

 

「site:URL/ディレクトリ」

 

この範囲内で調べるとディレクトリ内で低品質ページや思わぬ重複ページがインデックスされていることに気がつくパターンもあるので試してみてください!

 

その他のコマンド例

Googleの「Site:」コマンドのオプション25個 SEOmoz | デジタルマーケティングブログ

 

canonicalを設定していても不要なページは削除すべし

site:関連で調べてようやく低品質ページを見つけても、しっかりと運営されている方なら重複ページや低品質ページに対してcanonicalを設定していることでしょう。

 

だからどれだけ時間をかけて見つけてもキチンと対応していたら

 

(な)んだよ!時間の無駄だったわ!!!

 

となるかもしません。

 

でも、根本的に低品質なページは存在していることがユーザーにとって混乱を招くページなので削除してしまったほうが良いと思うんですね。

 

評価をしないで欲しいページっていらなくない?

 

評価してほしくないんでしょ?

 

似たページがあるんでしょ?

 

それであれば評価してほしいページにリンクさせれば良いわけで、Googleにとってもユーザーにとってもサイト内遷移する際には無駄な工程でしかないのでやはり削除したほうが良いでしょうね。

 

絶対必要なページだけど評価して欲しくないページに関してはcanonicalを活用するかコンテンツの質を上げるといった対応をすればプラスに働くと思いますよ。

 

 

 

補足:はてなブログの場合

通常サーバーを借りてサイト運用する場合はrobots.txtや.htaccessで制御したり転送設定もできますが、はてなの場合は(おそらく)できません。

 

心外にも別URLで同一コンテンツが生成されることが多々あります。

 

これどうにかしたいんですが、特定の記事やカテゴリーにcanonicalを入れられないのかしら〜・・・

 

それかその該当ページをnoindexにしたい。

 

はてなの謎システムはまだまだ解明できないでいます。