ニュース
OpenAIがWebクローラー「GPTBot」の文書を公開、クロールを禁止するには?:個人情報などはどう扱うのか
OpenAIがWebクローラー「GPTBot」の文書を公開した。同時に、個人情報などの扱い方やアクセスを禁止したり、カスタマイズしたりする方法なども記載している。
OpenAIがWebクローラー「GPTBot」の文書を公開した。GPTBotはOpenAIが使用するWebクローラーで、クロールされたWebページは、OpenAIのAIモデルを改善するために使用される可能性がある。
OpenAIは「GPTBotがWebサイトにアクセスできるようにすると、AIモデルの精度が向上し、一般的な機能と安全性が向上する。(一方で、)ペイウォールアクセスを必要とするソース、個人を特定できる情報(PII)を収集することが知られているソース、またはポリシーに違反するテキストを含むソースを削除するためにフィルタリングする」としている。
GPTBotは次のユーザーエージェントと文字列によって識別できる。
User agent token: GPTBot Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
GPTBotの禁止
GPTBotによるサイトへのアクセスを禁止するには、GPTBotをサイトのrobots.txtに追加する。
User-agent: GPTBot Disallow: /
GPTBotのアクセスをカスタマイズする
GPTBotがサイトの一部のみにアクセスできるようにするには、次のようにGPTBotトークンをサイトのrobots.txtに追加する。
User-agent: GPTBot Allow: /directory-1/ Disallow: /directory-2/
IPアドレスレンジ
OpenAIのクローラーは、OpenAIのサイトに記載されているIPアドレスレンジからWebサイトにコールする。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Zoom「顧客の同意なしに、AIモデルのトレーニングに顧客コンテンツを使用することはない」と発表
Zoomの最高プロダクト責任者が「Zoomの利用規約は、同意なくユーザーコンテンツをAIトレーニングに利用できる」という技術系情報サイトの懸念、議論に対して「Zoomのサービス規約と業務慣行はAI機能にどのように適用されるか」と題したブログ記事を公開した。AI規制に必要な国際協調と実践的行動とは
AI(人工知能)の普及が加速し、早々にAI規制の枠組みやインフラの確立が求められている。本稿では、国際規制機関が対処すべきAIの脅威をカテゴリー別に3つ紹介する。英情報保護監督機関、顔認識DB企業Clearview AIに755万ポンドの罰金と英国居住者データの削除を命令
英国情報コミッショナー局は、米国Clearview AIに755万2800ポンド(約12億円)の罰金を科した。同社がインターネットから勝手に収集した英国内外の人々の画像を使用して、顔認証に使用可能なグローバルオンラインデータベースを作成したためだ。