好奇心

直感・閃き・気になる事探究を楽しむ

簡単イラスト解説!ページをインデックスさせない理由

「あえて検索エンジンにページをインデックスさせない」その意味を理解してない人へ理由と対策をわかりやすいイラストを用いて解説
あえてインデックスさせない

こんな質問を頂きました↓open

たぬきちさん はじめまして
レポートをダウンロードした事をきっかけにメルマガ拝読してます
凄く深い内容の検証をされている方にこんな単純な質問で
申し訳ないのですが、どうしても知りたいので教えてください
検索エンジンにインデックスさせない とはどういうことですか?
こちらとしては検索結果に表示されるならどんな形でもいい
それくらい登録されたい気持ちですが、あえてインデックスさせない事に
何の意味があるんでしょうか?

いい質問です(´∀`)9 ビシッ! Σ(゚Д゚;)デタ!!
↓ ↓ ↓ 本文で回答 ↓ ↓ ↓

検索エンジンに登録されることからすべては始まる

ネット上での情報発信活動って趣味だろうが、商売だろうが
何はなくともまず「存在認知」
検索エンジンに認識してもらってなんぼです
だから、最初は welcome( ゚∀゚)ノおいでませ~クローラー
最近はその「インデックスまでの道」がとてつもなく遠くなったんだけどね・・
検索エンジンにインデックスされない事より怖いのは・・
「site:」と「info:」と「ページオーソリティ」との関係性
さて、このクローラーとの付き合い方が今回の重要テーマ
わかりやすくイラストと例え話で再現しよう

クローラーという友達ができました

クローラー 友達
最初は「はじめまして」から始まったクローラーとの付き合いが
毎回会うたびに「どうも」「よっ!」「まいど~」と距離感も縮まり
だんだんと訪れる頻度が上がっていく(クローラーの常駐)
例えるなら友達の家に遊びに来て
友達そっちのけで、ねっころがって漫画本読んで
読み終わったら知らないうちに帰っていくずうずうしい奴 みたいな・・
クローラー常駐
でもね、親しき仲にも礼儀ありって奴でして・・
あんまり親しい関係になりすぎるのも考え物なのです

プライバシーの侵害を防げ!(インデックスコントロール)

本当は人に見せたくない・・知られたくない
いわゆるプライバシーって誰にでもあるもの
でも、それって自分が思ってるだけであって
実際は「鍵」をかけたり、「隠したり」なんらかの処置が必要です
当然、思ってるだけでは侵害されてしまうものなのです
プライバシーの侵害
自分から見れば「大事なものが入ってる箱」
他人から見れば、「ただの箱」
悪気はないんですよね、しいて言うなら
ただそこに「箱があったから開けてみた」って話です
箱を開けてみた
これはWEB上でドメイン/・・サブドメイン/・・ディレクトリ → htmlページ
と、運営するURL内にあるページをくまなくクロールされるという事です
だた一度、場所中身を覚えられてしまうとこんな事が起きてしまいます

公開されたくない情報がWEBに公開された時の対処

このクローラーという友人はとにもかくにも口が軽い・・
見つけた情報を外に漏らしてしまう訳です(検索結果に表示)
検索結果に表示
一度こうなってしまうと、もう時すでに遅しで・・
見られたくないもの他人に見られてしまうのです
ほっとくと、その状態が延々と続くので
これ以上、外に広げないために「口封じ」をします
口封じ

指定したURLを検索結果に表示しない

URL削除ツール

URL削除ツール

URL 削除ツールは、誤って機密情報が公開されているページなど
すぐに削除する必要があるページに使用します
※Googleウェブマスターツールで登録しているサイトに利用可能です
しかし、このクローラーという友人の行動力は侮れません
いつ、他の見られたくない物が勝手に公開されるかひやひやもの・・
そこで、大事なものをクローラーから守る方法を実践しないといけません

鍵(パスワード)をかけて進入を防ぐ

鍵をかける
一番単純な方法なのですが、鍵(パスワード)をかけて
そのドメイン内の特定のディレクトリにアクセス不能にする方法です
一番合理的な進入ブロックの方法だけど・・
これでは、クローラーさんの情報収集は防げません
クローラー 情報収集
検索結果上でURLをクリックするとパスワードを求められるという
アクセス不能なのに表示されてしまうという悲劇・・
そこで、鍵をかけるよりも確実なクローラー対策があります

クローラーに事前にインデックスしないでと伝える

至極簡単なことで話し合いです
禁止事項
事前に、やってほしくない事を意思表示します
これをインデックスコントロール(ロボット制御)といいます
WEB上で意思を事前通達するには以下のタグを「head」に入れます

<meta name="ROBOTS" content="○○,××">

実はこの「content=」の中に入る項目によって
クローラーへの指示も大きく変わります

content="ALL" … その文書の収集を許可し、リンクを辿ることも許可する
content="INDEX, FOLLOW" … その文書の収集を許可し、リンクを辿ることも許可する
content="INDEX, NOFOLLOW" … その文書の収集は許可するが、リンクを辿ることは拒否する
content="NOINDEX, FOLLOW" … その文書の収集は拒否するが、リンクを辿ることは許可する
content="NOINDEX, NOFOLLOW" … その文書の収集を拒否し、リンクを辿ることも拒否する
content="NONE" … その文書の収集を拒否し、リンクを辿ることも拒否する

それぞれ意味が違うので、利用する際は理解してご利用ください

WordPressならAllinOneSEOPackの項目で利用可能

AllinOneSEOPackの項目
また、ワードプレステーマによってはプラグインなし
このインデックスコントロールの仕組みに対応してるものもあります

※私が利用してるDigipressは完全対応

Digipressテーマ HTMLメタ情報設定
プラグインいらずのシステムテーマ Digipressテーマとは?

インデックスコントロール対策は「SIRIUS」でもできる

上級設定 インデックスcontrol
バージョン1.2以降から搭載されたheadタグ挿入要素の追加機能として
個別ページの上級設定のプルダウンから選択が可能
SIRIUSバージョン1.2 追加機能と変更点まとめ
このページは検索結果に表示されたくない
そういった場合にのみにしか利用用途がない
わかりやすい機能です
これで頻繁に家に出入りする友人(クローラー)がいても
「自分のプライバシー」を守りつつ上手に付き合えます
結局の所、こういった問題を事前に防ぐには
検索エンジンクローラーWEBサイトオーナーとの話し合い
お互いが認識できるルールの活用
あえてインデックスさせない・・というケースも往々にしてある!
という事を頭の片隅にでも記憶しておくといいです

使う理由がなければ無理に使わない

このインデックスコントロールは意味を理解しないで使うと
「全ページがインデックスされなくなる」など大きなリスクを伴いますので
使う際は「使うべき理由」をしっかりと考えてから使ってね(*´∀`*)
手っ取りはやいのは鍵をかけて入れなくするでも問題ないけど
鍵つきページも普通にインデックスされるから不思議┐(´∀`)┌ヤレヤレ

COMMENTS & TRACKBACKS

  • Comments ( 2 )
  • Trackbacks ( 0 )
  1. たぬきちさん、こんばんは。
    御世話になります、影太郎です。
    先日はありがとうございました!
    見られちゃ困るページ。
    今のところ無いです^^
    ワードプレスでブログ始める時に色々と調べていて
    見られちゃ困るページ(インデックスさせない)については
    わかっていたので気をつけています。
    確かテンプレートで出来たかな?
    今は削除してしまいましたが、住所などは
    インデックスされては困るので対策した記憶が・・・
    しかし「お宝」はベットの下が定番ですね。
    私も若い頃はそうでした。
    今はHDDの中!
    隠しフォルダ作って見つからないように・・・
    ってやってましたが隠しフォルダごとデータ飛んだことがあり
    今ではなくなってしまった(笑)
    この辺の管理も気をつけないと^^

    • 影太郎さん( ゚∀゚)ノ
      あの件についてはあせらずじっくりご検討を
      使ったら今すぐどーなるってもんでもなく
      「使い道」が見えてからこそ、力を発揮しますので
      見られちゃ困るページっていっても特典用に用意しておいて
      「パスワードをかけるのを忘れたページ」とかですよ
      後悔は先に立たないのに公開は先にされちゃうという罠(;゚Д゚)
      テンプレートの仕組みで設定もできるけれど
      「その仕組みがエラーで動いてない」・・とかもよくある話なので
      知識として知っておくと万が一の時に対処できますよ(*´∀`*)
      お宝はベッドの下、布団の間・・なぜなんでしょうね
      テレビドラマ?漫画?何の影響かわからないけれど
      なぜか全国の中高生は以心伝心に同じ場所に隠す(笑)
      ティッシュとおかずは手の届く範囲という
      しごくだけに至極合理的な配置を
      賢者タイムにでも考えてるんでしょうね
      今は「木」を隠すなら「森」です
      「仕事用フォルダ」って名前で保存(笑)

LEAVE A REPLY

*
*
* (公開されません)

Return Top