一色からは「執筆者のためのChatGPTの使い方」と「Code Interpreterに見るデータ分析の近未来」について、かわさきからは『ChatGPTの頭の中』(ハヤカワ新書)というお勧め本の概要紹介を書きました。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
@ITのDeep Insiderフォーラム【AI・データサイエンスの学びをここから】を担当しているDeep Insider編集部の一色とかわさきです。4月末に公開した編集後記から3カ月ぶりですね。
編集者が記す「あとがき」である、この編集後記では、執筆/編集時には書けなかった小話や裏話、感想、ぜひ読者にも知ってほしいという話などを書いています。半分は会員登録後に読めるようになっていますが、無料ですのでこの機会に会員登録して2人分を読んでいただけるとうれしいです。
@ITのDeep Insider編集部の編集長。苦労して半年以上かけて学んできた「Google データアナリティクス プロフェッショナル認定証」講座は何とか修了できました。なじみが薄かったR言語やTableauを学ぶきっかけとなったのが良かったです。でもやっぱりできるならPythonを使いたいですね……。
OpenAIのChatGPT関連の話題はなかなか尽きませんね。2023年7月9日頃にCode Interpreter(後述)が、2023年7月21日にCustom instructions for ChatGPT(カスタムの事前条件を設定できる機能)が使えるようになりました。最初の目的は「機能性を検証する」ためだったのですが、私は2023年5月に有料プランのChatGPT Plusを契約し、それから今日まで毎日のように便利に使っています。個人的に20米ドル(2023年7月26日の執筆時点で約2800円)を支払っていますが、不満もなく、今のところ無料プランに戻す気は全然ありません。
今回は、そんなChatGPTヘビーユーザーである私の視点で「執筆者のためのChatGPTの使い方」について簡単に紹介し、さらに「Code Interpreterに見るデータ分析の近未来」についても意見を述べようと思います。参考になると幸いです。
ChatGPTなどで生成した「文章」をそのまま記事に使うというのは、Deep Insiderで規定している生成系AI利用ルールでも禁止していますし、個人的にも絶対にあり得ないことだと思います。「こう書いた方が分かりやすい」など自分なりの書き方もあるので、私個人の場合、ChatGPTが生成した文章は受け入れられないですね。
私の場合、ChatGPTはそもそも文章を生成するためではなく、
という執筆サポート目的で使っています。過去の執筆でChatGPTに入力したプロンプト例をそれぞれ紹介します。
以下の説明に間違っているところはありますか?
<1段落分の文章群。>
このプロンプトは、「言語モデルのスケーリング則」という記事で、「べき乗の説明が間違っていないか」を自己確認するために使いました(※もちろんこの後に、社内で査読も行います)。
その結果、「この説明は基本的には正確です。幾つかの部分を明確にするための提案があります。」などと返答されて、例えば「べき乗」に対する「累乗(るいじょう)」の補足説明に対して「日本語の数学用語として『べき乗』と『累乗』はしばしば区別されます。……中略……この区別は英語圏など他の言語では行われていないこと、また日本でも一般的な教科書や授業で『べき乗』という用語がより広く使われていることを理解しておくとよいでしょう。」などのアドバイスを受けたので、その都度、判断して文章を微修正していきました。
妄信的にChatGPTを信用しているのではなく、自分の知識と照らし合わせたり、事実を調査&確認したりした上で判断して、「ちょっと書き方が悪かったな」「確かに誤解を与えてしまうかも」といった理由で修正を入れています。
以下の文章は分かりやすいでしょうか? 新卒の社会人1年生が読むとして、分からない部分があったら教えてください。必要があれば、訂正の文章を教えてください。
<1段落分の文章群。>
このプロンプトは、「初めてのデータ分析。手軽に体験してみよう」という記事で、まだ基礎知識を持っていない新卒の社会人1年生でも分かる文章を書くために使いました。
その結果、「分かりやすい文章ですが、一部の箇所をより具体的に説明すると、新卒の社会人1年生にとってさらに理解しやすくなるかもしれません。以下は修正版です。」などと返答されて、例えば「ビジネスの機会を損失している」を「ビジネスの機会を逃している」とした方が分かりやすい、などのアドバイスを受けたので、その都度、判断して文章を微修正していきました。
実はこの記事の全般、特に前半は、段落ごとに「分かりやすいかどうか」をChatGPTに聞いてみました。この記事の場合、難しい漢字や単語にまとめてしまったり、専門用語を使ってしまったりしていることに幾つも気付かせてくれたので、執筆段階で文章を何度も書き直して推敲(すいこう)しました。だからこの記事は、私のいつもの文章よりも平易で読みやすくなっているはずです……。
あっ、この編集後記は急いで書いたので、ChatGPTを使った推敲はしていません。読みづらかったらごめんなさい……。
上で紹介したような使い方はありですね。僕も今度からやってみようかな。
各所で話題になっていますが、Code Interpreterは特にデータ分析やシンプルな機械学習に役立つ、驚くべきChatGPTの新モードです。数千〜数万件のデータを含むファイル(執筆時点でファイルサイズは最大250MBまで)をChatGPTにドラッグ&ドロップでアップロードして、指示や質問をするだけでグラフ化や分析が可能です。結果をスライド資料にまとめてダウンロードすることもできます。そういった処理のバックグラウンドでは、分析などを実行するためのPythonコードが生成されて自動実行されます。
これまで、ChatGPTが生成した内容はあくまで言語モデルが推論したものであり「信頼性に欠ける」と私は思っていましたが、Pythonコードを実行した結果であるなら、手動でコードを書いて実行するのと変わらないので「信頼できる」と考えています。なお、Pythonコードは隠れた状態で表示されますが、それを開いて「どんなコードか」も確認できます(図1)。生成されたコードの間違いなどを自分でチェックできるのでさらに安心ですね。
ただし、「今すぐ現場で使おう」と言いたいところですが、現状のCode Interpreterにはセキュリティー上の不安があるため実践活用はまだお勧めできません。詳しい情報ソースは省きますが、X(旧:Twitter)でのツイートで「全然違う他人のファイルの中味が出てきてドキっとした」という報告が挙がっています(バグと思われます)。現時点では外部公開してはいけないファイルなどはアップロードしない方が無難ですね。
とはいえ、近い将来にはChatGPTなどでデータ分析や機械学習が半自動的に行えるようになり、それも実用レベルである可能性は高いと思っています。私は半年ぐらい前から、AI/機械学習/データ分析/データサイエンスは、AI(機械学習)エンジニアやデータサイエンティストなどの専門職だけが行うのではなく、あらゆる分野のソフトウェアエンジニア、さらには一般のビジネスパーソンまでもが行うようになる、つまり「データ&AI活用は民主化していく」という未来を予想していますが、ますますそれが現実になりそうだと考えています。逆に専門職は、より専門化し高度化していくと思います。
ポジショントークのようになってしまいますが、そういった民主化時代にも、適切な流れで作業して、実行内容を的確に理解するためには『AI・データサイエンス超入門』や『Python入門』のような基礎知識は必要とされるでしょう。民主化時代に有用なコンテンツを今後も粛々と拡充していきますので、ぜひ今後ともご愛読お願いします。あとCode Interpreterについても、いずれどこかで記事化するつもりです。
この業界には「言い出しっぺがやる」ルールがあるので、一色さんが原稿を書いてくださいね。僕はそれを読んで勉強します(笑)。
あっ、はい(汗)。Code Interpreterをもっと使ってみないと……。
大学生時代にIT系出版社でアルバイトを始めて、そのまま就職という典型的なコースをたどったダメ人間。退職しても何か他のことをできるでもなくそのままフリーランスの編集者にジョブチェンジ。そしてDeep Insider編集部に拾ってもらう。お酒とおつまみが大好き。通称「食ってみおじさん」。だが、前回に紹介したようにダイエットを進めているので、現在ではお酒とおつまみから縁遠くなってしまうことに……。
あ、ダイエットを始めてから2週間ほど体重測定すらしていなくって、ゴールデンウィーク終わりにようやく体重を量ったのですが、そこから約2か月半で10kgほど体重が落ちました(いえーい)。ここからまだ10kgくらいは体重を落としたいと思っています。今は「すごいデブ」から「かなりデブ」になったくらいなので「そこそこデブ」を目指します。
順調なペースですごいですね。うらやましい。chocoZAPだけでなくお酒も控えているから、効果が高いのかな。
やー、ChatGPTが相変わらず流行っていますねー(「『ChatGPT』、公開以来初めて月間トラフィックが減少」なんて記事も出てきているわけではありますが)。Code Interpreterなんて機能も追加されていますし(一色さんが紹介していましたね)、Amazonで「ChatGPT」をキーワードに検索かければ書籍も山のように出版されています(そういえば、本フォーラム「Deep Insider」の連載『ChatGPT入門』もまとめてeBookになっていますので、情報は古くなりつつありますが、興味のある方はぜひ)。
そんなわけで、今日は山ほど出版されているChatGPT関連書籍の中から気になったものを1冊ご紹介しようと思います。自分が(SF小説を読むという意味で)昔からお世話になっている早川書房さんから出版されている『ChatGPTの頭の中』(ハヤカワ新書 009)という本がその1冊です。
早川書房さまにはぜひとも『銀河帝国興亡史』シリーズの4巻以降の電子書籍化もよろしくお願いしたいところ(紙では読んでいますが、あの話の上巻はどこにいったんだとか、この話の下巻が見つからないぞとか、とても困っているのです)。あと、『紅衣の公子コルム』シリーズとか。それから、書いていて思い出しました。エフィンジャーの『重力が衰えるとき』も家の中でどこにいったか分からないんですが、たまに読みたくなるんですよね。まだまだ電子書籍化を希望する本が山ほどありますのでよろしくお願いします。
著者はスティーヴン・ウルフラム(Stephen Wolfram)。数式処理システムとして有名なMathematicaの生みの親でもあります。そんな彼が表したのが原著である『What Is ChatGPT Doing … and Why Does It Work?』です(原著のオンライン版はこちら)。
本書は第1部「ChatGPTは何をしているのか、なぜ動くのか」と第2部「Wolfram|Alpha」の2部構成となっていて、第2部は著者(と彼が率いる会社)が開発しているWolfram|AlphaとChatGPTとの組み合わせについてのお話です。従って、ChatGPTの頭の中をのぞいてみたいという方にとってメインとなるのは第1部の方でしょう(しかし、第2部があるのは、ChatGPTには限界があり、Wolfram|Alphaと組み合わせることでその限界をいかに超えられるかまでを書きたかったんでしょうなぁと感じました)。
で、第1部ではまずChatGPT(や他の大規模言語モデル)は基本的にはあるテキストを受け取ったときに、その続きとして順当な単語(トークン)を生成するものだとし、実例を交えながらその基礎的な振る舞いや、どうすれば出力を改善できるのかといった話があります(このときの実例にはChatGPTではなくGPT-2やGPT-3が使われています)。
その後、話は大規模言語モデルから一度離れて、ニューラルネットワークの基本的な知識についての解説が続きます。人によっては「なげーよ」と思うかもしれないほどの量がありますが、分かっている人なら「うんうん」と読めるものである一方、そうでない人には若干骨太な内容かもしれません。ですが、ここまでのことを書いておかないと、多くの人は読み進めないと著者は感じたのでしょう。
そして、話はChatGPT(GPT-3)のモデルがどんな構造なのかに話は進み、トランスフォーマーやアテンションといった用語も出てきて、モデルの内部ではどんな風に処理が行われていくかやモデルの訓練についての解説が続きます。「この辺の話はRLHFのことなんだろうな」と思う箇所もありますが、RLHFについては巻末の監訳者解説で詳しく述べられています。
最後にはChatGPT(や恐らくは他の大規模言語モデルでもそうでしょう)がなぜうまく言葉を紡ぎ出せるのかについての考察やChatGPTが成功したことで示唆されること、人の脳と言語モデルの違い、ChatGPTの限界とその改善策などについて、著者が取り組んできた計算言語という概念と絡めて述べられています。
第2部はChatGPTが間違えた出力をWolfram|Alphaでうまく対応して、ChatGPTに正しい出力をさせる方法が幾つもサンプルを使って示されています。これでWolfram|Alphaに興味を引かれる人もいるでしょう。
というわけで、本書はChatGPTとは何か、ニューラルネットワークの基礎知識、ChatGPTが内部でやっていることなどを数式などを使うことなくまとめながら、人の言葉とは何か、思考とは何かといったことについても洞察をしていく1冊となっています。分量の都合もあるのでしょうが、個別の要素について詳細に踏み込んでいるわけではありません。本書をフックにさらにネットなり書籍なり論文なりで知識を深めたいという方にはよいでしょう。
なお、監訳者解説についてはWebで公開されているのでそちらを読むことで、購入するかどうかの判断に使えるのではないでしょうか。
本書もよかったけど、ハヤカワ新書であれば『ソース焼きそばの謎』も紹介したかったです(笑)。
私も最近、同じような内容の本で『大規模言語モデルは新たな知能か ChatGPTが変えた世界』(岩波科学ライブラリー 319)を読みました。機械学習について知らない一般ビジネスパーソンでも読めるように書かれていてお勧めです。130ページの薄い本なので、ある程度の知識がある人なら数時間で読み終わります。
Copyright© Digital Advantage Corp. All Rights Reserved.