一色からは「執筆者のためのChatGPTの使い方」と「Code Interpreterに見るデータ分析の近未来」について、かわさきからは『ChatGPTの頭の中』(ハヤカワ新書)というお勧め本の概要紹介を書きました。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
@ITのDeep Insiderフォーラム【AI・データサイエンスの学びをここから】を担当しているDeep Insider編集部の一色とかわさきです。4月末に公開した編集後記から3カ月ぶりですね。
編集者が記す「あとがき」である、この編集後記では、執筆/編集時には書けなかった小話や裏話、感想、ぜひ読者にも知ってほしいという話などを書いています。半分は会員登録後に読めるようになっていますが、無料ですのでこの機会に会員登録して2人分を読んでいただけるとうれしいです。
@ITのDeep Insider編集部の編集長。苦労して半年以上かけて学んできた「Google データアナリティクス プロフェッショナル認定証」講座は何とか修了できました。なじみが薄かったR言語やTableauを学ぶきっかけとなったのが良かったです。でもやっぱりできるならPythonを使いたいですね……。
OpenAIのChatGPT関連の話題はなかなか尽きませんね。2023年7月9日頃にCode Interpreter(後述)が、2023年7月21日にCustom instructions for ChatGPT(カスタムの事前条件を設定できる機能)が使えるようになりました。最初の目的は「機能性を検証する」ためだったのですが、私は2023年5月に有料プランのChatGPT Plusを契約し、それから今日まで毎日のように便利に使っています。個人的に20米ドル(2023年7月26日の執筆時点で約2800円)を支払っていますが、不満もなく、今のところ無料プランに戻す気は全然ありません。
今回は、そんなChatGPTヘビーユーザーである私の視点で「執筆者のためのChatGPTの使い方」について簡単に紹介し、さらに「Code Interpreterに見るデータ分析の近未来」についても意見を述べようと思います。参考になると幸いです。
ChatGPTなどで生成した「文章」をそのまま記事に使うというのは、Deep Insiderで規定している生成系AI利用ルールでも禁止していますし、個人的にも絶対にあり得ないことだと思います。「こう書いた方が分かりやすい」など自分なりの書き方もあるので、私個人の場合、ChatGPTが生成した文章は受け入れられないですね。
私の場合、ChatGPTはそもそも文章を生成するためではなく、
という執筆サポート目的で使っています。過去の執筆でChatGPTに入力したプロンプト例をそれぞれ紹介します。
以下の説明に間違っているところはありますか?
<1段落分の文章群。>
このプロンプトは、「言語モデルのスケーリング則」という記事で、「べき乗の説明が間違っていないか」を自己確認するために使いました(※もちろんこの後に、社内で査読も行います)。
その結果、「この説明は基本的には正確です。幾つかの部分を明確にするための提案があります。」などと返答されて、例えば「べき乗」に対する「累乗(るいじょう)」の補足説明に対して「日本語の数学用語として『べき乗』と『累乗』はしばしば区別されます。……中略……この区別は英語圏など他の言語では行われていないこと、また日本でも一般的な教科書や授業で『べき乗』という用語がより広く使われていることを理解しておくとよいでしょう。」などのアドバイスを受けたので、その都度、判断して文章を微修正していきました。
妄信的にChatGPTを信用しているのではなく、自分の知識と照らし合わせたり、事実を調査&確認したりした上で判断して、「ちょっと書き方が悪かったな」「確かに誤解を与えてしまうかも」といった理由で修正を入れています。
以下の文章は分かりやすいでしょうか? 新卒の社会人1年生が読むとして、分からない部分があったら教えてください。必要があれば、訂正の文章を教えてください。
<1段落分の文章群。>
このプロンプトは、「初めてのデータ分析。手軽に体験してみよう」という記事で、まだ基礎知識を持っていない新卒の社会人1年生でも分かる文章を書くために使いました。
その結果、「分かりやすい文章ですが、一部の箇所をより具体的に説明すると、新卒の社会人1年生にとってさらに理解しやすくなるかもしれません。以下は修正版です。」などと返答されて、例えば「ビジネスの機会を損失している」を「ビジネスの機会を逃している」とした方が分かりやすい、などのアドバイスを受けたので、その都度、判断して文章を微修正していきました。
実はこの記事の全般、特に前半は、段落ごとに「分かりやすいかどうか」をChatGPTに聞いてみました。この記事の場合、難しい漢字や単語にまとめてしまったり、専門用語を使ってしまったりしていることに幾つも気付かせてくれたので、執筆段階で文章を何度も書き直して推敲(すいこう)しました。だからこの記事は、私のいつもの文章よりも平易で読みやすくなっているはずです……。
あっ、この編集後記は急いで書いたので、ChatGPTを使った推敲はしていません。読みづらかったらごめんなさい……。
上で紹介したような使い方はありですね。僕も今度からやってみようかな。
各所で話題になっていますが、Code Interpreterは特にデータ分析やシンプルな機械学習に役立つ、驚くべきChatGPTの新モードです。数千〜数万件のデータを含むファイル(執筆時点でファイルサイズは最大250MBまで)をChatGPTにドラッグ&ドロップでアップロードして、指示や質問をするだけでグラフ化や分析が可能です。結果をスライド資料にまとめてダウンロードすることもできます。そういった処理のバックグラウンドでは、分析などを実行するためのPythonコードが生成されて自動実行されます。
これまで、ChatGPTが生成した内容はあくまで言語モデルが推論したものであり「信頼性に欠ける」と私は思っていましたが、Pythonコードを実行した結果であるなら、手動でコードを書いて実行するのと変わらないので「信頼できる」と考えています。なお、Pythonコードは隠れた状態で表示されますが、それを開いて「どんなコードか」も確認できます(図1)。生成されたコードの間違いなどを自分でチェックできるのでさらに安心ですね。
ただし、「今すぐ現場で使おう」と言いたいところですが、現状のCode Interpreterにはセキュリティー上の不安があるため実践活用はまだお勧めできません。詳しい情報ソースは省きますが、X(旧:Twitter)でのツイートで「全然違う他人のファイルの中味が出てきてドキっとした」という報告が挙がっています(バグと思われます)。現時点では外部公開してはいけないファイルなどはアップロードしない方が無難ですね。
とはいえ、近い将来にはChatGPTなどでデータ分析や機械学習が半自動的に行えるようになり、それも実用レベルである可能性は高いと思っています。私は半年ぐらい前から、AI/機械学習/データ分析/データサイエンスは、AI(機械学習)エンジニアやデータサイエンティストなどの専門職だけが行うのではなく、あらゆる分野のソフトウェアエンジニア、さらには一般のビジネスパーソンまでもが行うようになる、つまり「データ&AI活用は民主化していく」という未来を予想していますが、ますますそれが現実になりそうだと考えています。逆に専門職は、より専門化し高度化していくと思います。
ポジショントークのようになってしまいますが、そういった民主化時代にも、適切な流れで作業して、実行内容を的確に理解するためには『AI・データサイエンス超入門』や『Python入門』のような基礎知識は必要とされるでしょう。民主化時代に有用なコンテンツを今後も粛々と拡充していきますので、ぜひ今後ともご愛読お願いします。あとCode Interpreterについても、いずれどこかで記事化するつもりです。
この業界には「言い出しっぺがやる」ルールがあるので、一色さんが原稿を書いてくださいね。僕はそれを読んで勉強します(笑)。
あっ、はい(汗)。Code Interpreterをもっと使ってみないと……。
大学生時代にIT系出版社でアルバイトを始めて、そのまま就職という典型的なコースをたどったダメ人間。退職しても何か他のことをできるでもなくそのままフリーランスの編集者にジョブチェンジ。そしてDeep Insider編集部に拾ってもらう。お酒とおつまみが大好き。通称「食ってみおじさん」。だが、前回に紹介したようにダイエットを進めているので、現在ではお酒とおつまみから縁遠くなってしまうことに……。
Copyright© Digital Advantage Corp. All Rights Reserved.