AIが生成した文章を人間の文章と見分けるツール、ChatGPTも出したOpenAIが試験提供を開始：現在のところ英語のテキストが主な対象

OpenAIが、AIの生成した文章を人間の書いた文章と識別するツールを公開した。ChatGPTと同様、ログインすれば誰でも無料で試せる。ただし、今回のツールの精度が低いことを同社は認めている。

[三木泉，＠IT] PC用表示

LINE

Hatena

　OpenAIは2023年1月31日（米国時間）、AIによって生成された文章を見分けるツールの試験的な提供を開始した。ChatGPTと同様、登録してログインすれば誰でも無料で使えるようになっている。なお、このツールは命名されていない。

　「AIによって書かれた文章を全て、十分な信頼性をもって検出することは不可能だが、優れた分類器を使用すれば、AIが生成した文章を人間が書いたとする嘘の主張に対処するための情報を提供できる」（OpenAIのブログポストより、以下同）

　OpenAIは例として、自動化された情報操作、アカデミックな場での不正、AIチャットボットの人間としての偽装を挙げている。一方で、教育者の間でChatGPTに対する懸念が広がっていることに触れ、今回のような分類器には限界があるとして、ChatGPTに関する理解を広げるためのドキュメントを公開していると述べている。また教育者とのChatGPTに関する議論を続けていくという。

　今回の判定ツールは信頼性が十分ではないことを、同社は認めている。

　英語の文章を使ったテストでは、AIが書いた文章を「AIによって書かれた可能性が高い」と正しく識別した比率（真陽性率）は26％、人間が書いた文章を、誤ってAIが書いたと識別した比率（偽陽性率）は9％だったという。

「このような不完全なツールが有用かどうかについてのフィードバックを得るために、公開することにした。AIが生成した文章の識別についての取り組みを継続し、改善された方法を将来的に共有したいと考えている」

今回の判定ツールの弱点とは

　今回のツールの弱点や限界について、OpenAIは次のように説明している。

短い文章（特に1000ワード以下）では信頼性が非常に低い。長い文章でも、誤ったラベル付けをすることがある。
人間が書いた文章を、確信的に「AIが生成した」と誤りのラベル付けをすることがある。
英語の文章のみを対象とすることを推奨する。他の言語ではパフォーマンスが大幅に低下し、コードについては信頼できる結果が得られない。
予測可能性の高い文章は、確実に識別できない。例えば、最初の1000個の素数リストが AIによって書かれたものか、人間によって書かれたものかを予測することは不可能。正解は常に同じだからだ。
AIが生成した文章を編集することで、判定を回避できる。分類器のアップデートや再トレーニングは可能だが、検出性能が長期的に改善するかは不明だ。
ニューラルネットワークに基づく分類器は、トレーニングデータ以外でのキャリブレーションが難しいことが知られている。トレーニングセット内の文章とは大きく異なる入力の場合、分類器は間違った予測を極めて確信的に行うことがある。

AIが生成した文章を人間の文章と見分けるツール、ChatGPTも出したOpenAIが試験提供を開始：現在のところ英語のテキストが主な対象

今回の判定ツールの弱点とは

Cloud Native Central 記事ランキング