社会人が学ぶべき、やさしいAI・データサイエンス:AI・データサイエンス超入門
生成系AIを中心に、今、データ&AI活用が一般社会に広まってきています。そもそも「データ」や「AI」「データ分析」「データサイエンス」とは何なのか。それらの概念を説明し、AI・データサイエンスの全体像を整理します。さらに、社会人がAI・データサイエンスを学ばなければならない理由と学ぶ方法を紹介します。
最近は、テレビの経済ニュース番組などでChatGPTという生成系AIが毎日のように取り上げられるなど、かつてないほどAIが盛り上がっていますよね。そんな時代ですので、皆さんの社内でも、
AIとデータを活用しよう!
という話が出やすい状況ではないかと思います。
しかしそういう話になっても、
AIやデータを活用するのに、何を学べばよいのかが分からない
本を手に取ってみたが、自分には難しそう
といった感想を持っている人も少なくないのではないかと思います。
そんな普通の人、具体的にはAIやデータ分析/データサイエンスをこれまでに学んだことがない社会人(図1)に向けて、本連載では基礎中の基礎となる「データ&AIを活用したいなら、最初に知っておくべき全体概要」を紹介していきます。社会人1年目からすぐに学び始められるように、手を動かして体験しながら学べるやさしい内容です。構えずに「ちょっと試してみよう」と気軽な気持ちで読み進めてみてください。
今回は、初回なので手を動かす体験はないのですが、以下のように「AI・データサイエンスの概要」について紹介します。
- AI・データサイエンスとは何か?
- AI・データサイエンスを学ばなければならない理由
- AI・データサイエンスの整理と全体像
- AI・データサイエンスを学ぶ方法
連載:
この連載では、人工知能(AI)やデータ分析/データサイエンスをこれまでに学んだことがない社会人(新卒の社会人1年生からベテラン社員まで大歓迎!)に向けて、「データ&AIを活用したいなら、最初に知っておくべき全体概要」、具体的にはAI・データサイエンスの概要と、データ分析(数値予測などの分析系AI)、画像認識などの識別系AI、文章生成などの生成系AIを紹介します。
難しい知識の習得よりもシンプルな経験を重視して、手を動かして体験しながら学べる内容ですので、肩の力を抜いてぜひとも気楽に読み進めてください。
筆者紹介: @ITのDeep Insider編集部の編集長。2017年にAIの「G検定」(第1回)に合格し、2022年に「データサイエンティスト検定 リテラシーレベル」に合格。はてなブックマーク(アカウント名:misshiki)でAI&データサイエンスの最新情報をウオッチ中。考えるための補助ツールとしてChatGPTも時々使っています。
AI・データサイエンスとは何か?
最初に「AI/データ分析/データサイエンスって何なの?」という話から始めていきます。
これらに共通するのは「デジタルデータ」を活用することです。そもそもデータとは、事実や情報の集まりのことです。もっと具体的にいうと、数値やテキストなどで構成された表形式データや、テキスト/画像/動画/音声などのことです(図2)。この他にも、紙の書籍や新聞、手書きのメモ、体重や身長、料理の具材と分量など、あらゆる情報が「データ」と言えますが、ここでいうデジタルデータとは、パソコン(PC)などのコンピュータ上で扱えるように電子的(デジタル)な情報に変換されたデータのことです。
「AI」「データ分析」「データサイエンス」という用語には厳密な定義文が存在するわけではないので、ここでは筆者なりに以下のように定義しておきます(※それぞれのより詳しい定義と説明を知りたい場合は、各名称のリンク先を参照してください)。ちなみに、AI/データ分析/データサイエンスなどは、まとめてデジタル技術と表現される場合があるので、覚えておくとよいでしょう。
- AI(人工知能): (データから学習することで)読む/書く/聞く/話すなど人間が行う「知的活動」を疑似的に実現したコンピュータプログラム(=ソフトウェア)のこと
- データ分析(データアナリティクス): 基本的な統計処理などのデータ分析(データアナリシス)の手法を活用して、データから有用な結論や知見を導き出し、主にビジネス上の意思決定をサポートすること
- データサイエンス: 数学/統計学/機械学習といった科学的(学術的)な知識と、プログラミングといったITエンジニアリングのスキルと、組織や業務に関するビジネス知識を駆使して、(大量の)データから有用な結論や知見を導き出し、主にビジネス上の意思決定をサポートすること。なお、データサイエンスの仕事として、AIの実装が含まれることもある
図3を見ると、一般的なデータ分析と比べて、データサイエンスの方が深い学術知識と高いITスキルがより求められることが分かりますね。
図4を見ると、データサイエンスとAIの大きな違いは、「分析結果から得られたインサイト(洞察)によって“人間”が意思決定すること」に重きを置くか、「予測など何らかの処理を自動化/効率化する“ソフトウェア”(を作成すること)」に重きを置くか、という点にあることが分かりますね。例えば、売り上げデータを分析して人気が上昇する可能性のある商品を特定して、その商品をより効果的に売り出す意思決定をすることは、「データサイエンス」と言えます。また例えば、ChatGPTのようにチャット形式で文章を自動的に生成するソフトウェアは、「AI」と言えます。
これらの定義を見て、
やっぱり自分には関係ないかな?!
と思った方、ちょっと待ってください! 「これらを知らない」では済まされない時代になってきているからです。これについて次に説明します。
AI・データサイエンスを学ばなければならない理由
今は生成系AIが話題になっていることから、「知っておいた方がいいのかな」と気になっている人は少なくないと思います。実際に、大学や企業などでチャットAIの利用に関するガイドラインを発表することが増えてきており(例えば東京大学のガイドラインや、日本ディープラーニング協会が公開している企業向けひな型ガイドラインなど)、学術領域やビジネス領域での生成系AIの利用が徐々に広がってきていると感じられますよね(ちなみに大学方面では「生成系AI」と表記され、ニュースでは「生成AI」と表記されることが多い、と筆者は感じていますが、本連載では「生成系AI」という表記で統一しました)。
Copyright© Digital Advantage Corp. All Rights Reserved.