SEO & コンテンツ

AIボットアクセス制御

サイトのrobots.txtファイルを分析し、GPTBot、ClaudeBot、Perplexity、その他17種類のAIクローラーのアクセス状況をリアルタイムで確認できます。

AIボットアクセス制御
情報

AIボットのアクセス制御について

AI企業(OpenAI、Anthropic、Google、Meta、Amazonなど)は、ウェブをクロールしてAIモデルをトレーニングしたり、リアルタイム検索を実行したりするために、専用のボットを使用しています。これらのボットは、あなたのサイトにアクセスし、 robots.txt これは、設定ファイル内のルールによって決定されます。しかし、どのボットが許可され、どのボットがブロックされているかを一箇所で確認するのは非常に面倒です。

AIボットアクセス制御ツールは、あなたがアクセスしているウェブサイトを検証します。 robots.txt サーバーからファイルをリアルタイムで取得し、17種類のAIクローラー(GPTBot、ChatGPT-User、OAI-SearchBot(OpenAI)、ClaudeBot、anthropic-ai、Claude-Web(Anthropic)、PerplexityBot、Perplexity-User(Perplexity)、Google-Extended(Gemini/AI Overview)、Applebot-Extended、CCBot(Common Crawl)、Bytespider(TikTok)、Amazonbot、meta-externalagent、FacebookBot(Meta)、DuckAssistBot、cohere-ai)の状態を自動的に分析します。各ボットについて... 承認済み, 無効 または 指定なし(デフォルトの権限) 彼らのステータスは、色付きのバッジで確認できます。

結果画面には、AIボットをオフにする準備完了オプションも含まれています。 robots.txt ルール例も提供されています。サイト所有者でなくても、このツールを使って任意のサイトのポリシーを調査することもできます。すべてのクエリはサーバー側で行われ、リクエストはパブリックIPアドレスにのみ送信されます。セキュリティ上の理由から、ローカルネットワークおよびプライベートネットワークからのアクセスはブロックされます。

使い方は?

段階的に

  1. ドメイン名または完全なURLを入力してください(例) example.com または https://example.com).
  2. チェック ボタンをクリックすると、ツールがサイトに表示されます。 robots.txt ファイルを取得します。
  3. 各AIボットについて 承認済み, 無効 または 未指定 カラフルなバッジであなたのステータスを確認できます。
  4. 必要に応じて、ページ下部にある既成のルールをコピーしてご自身のサイトに貼り付けることができます。 robots.txt ファイルに追加してください。
FAQ

よくある質問

robots.txtは、ウェブクローラーがアクセスできるページを指示する標準プロトコルです。AI企業は、データ収集ボットがこのファイルに準拠するように努めています。このファイルを正しく設定することで、コンテンツがAIのトレーニングデータセットに含まれたり、リアルタイムのAI検索に使用されたりするのを防ぐ最も迅速な方法となります。

robots.txt ファイルにそのボットに対する特定のルールがなく、かつ `User-agent: * (all bots)` ブロックに制限事項が含まれていない場合、そのボットはデフォルトでアクセスが許可されているとみなされます。つまり、そのボットをブロックしたい場合は、カスタムルールを追加する必要があります。

いいえ、robots.txtは技術的な慣例であり、法的義務ではありません。真面目なAI企業のボットはこれらのルールに従うことを約束していますが、悪意のあるクローラーは無視する可能性があります。機密性の高いコンテンツについては、アクセス制御や認証などの追加措置を講じることをお勧めします。

Google-Extendedは、GoogleがGeminiやAI OverviewsなどのAI製品を開発するために使用する特別なクローラーIDです。これは通常のGoogle検索ボット(Googlebot)とは別個のものであり、このボットがブロックされた場合にのみ、ウェブページはGoogle検索結果に表示され続けます。

Common Crawlはオープンソースのウェブアーカイブプロジェクトであり、多くの主要な言語モデル(GPT-3/4を含む)がCCBotのデータを学習に使用しています。CCBotをブロックすることで、将来のオープンソースAIモデルに取り込まれるコンテンツの量を減らすことができます。