データ分析、AI/機械学習の実装、生成AIの活用(まとめてデータサイエンス)は、もはや多くの人に必要な知識となっています。これらの基礎はどうやって学べばよいのでしょうか? オススメの勉強方法を紹介します。
データを分析して、その背後にある有益な情報を取り出したい人向け。数学などの前提知識は不要! 身近に使える表計算ソフトで体験しながらデータ分析の考え方を学ぼう。
Pythonでデータ処理を始めようという人に向けて、pandasとは何か、インストール、データセットの読み込みと書き込み、簡単なメソッド呼び出しまでを説明します。(2024年4月5日)
OpenAIは、次世代推論AIモデル「o3」の軽量版となる「o3-mini」の一般提供を開始した。(2025/02/17)
Open Source InitiativeとOpen Futureは、ホワイトペーパー「オープンソースAIにおけるデータガバナンス:責任ある体系的なアクセスの実現」を発表した。この文書では、AIの根本的課題を解決するためのビジョンや行動が描かれている。(2025/02/15)
Linux Foundation Japanは、レポート「SPDX 3.0を用いたAI部品表の実装」を公開した。SBOMを拡張したAI BOMの概念を解説している。(2025/02/14)
Googleは2025年1月15日、同社の開発ツール「Vertex AI RAG Engine」について解説する記事を公開した。RAGの必要性やVertex AI RAG Engineのメリットなどが紹介されている。(2025/02/13)
生成AIの進化は、ビジネスと同義となっているシステムの在り方をどう変化させていくのか。ブログやコミュニティー活動を通じて「システムはLLMが前提に」と情報発信しているLayerX CTOの松本勇気氏に、話を聞いた。(2025/02/12)
「5分で分かるAI・機械学習・データサイエンス」は、 「機械学習」といった人工知能やデータサイエンスに関連する誰もが知っておくべき最重要キーワードの「概要」「歴史」「違い」「仕組み」「課題」「勉強方法」などを分かりやすく5分で説明するコーナーです。
「データ&AIを活用したいなら、最初に知っておくべき全体概要」、具体的にはAI・データサイエンスの概要と、データ分析(数値予測などの分析系AI)、画像認識などの識別系AI、文章生成などの生成系AIを紹介します。
『やさしいデータ分析』連載【記述統計&回帰分析編】。データをさまざまな角度から分析し、その背後にある有益な情報を取り出す方法を学びます。身近に使える表計算ソフト(ExcelやGoogleスプレッドシート)を利用。数学などの前提知識は不要です。
『やさしいデータ分析』連載【確率分布編】。データをさまざまな角度から分析し、その背後にある有益な情報を取り出す方法を学ぶ連載の続編で、確率分布に焦点を当てています。身近に使える表計算ソフト(ExcelやGoogleスプレッドシート)を利用。数学などの前提知識は不要です。
『やさしいデータ分析』連載【推測統計編】。データをさまざまな角度から分析し、その背後にある有益な情報を取り出す方法を学ぶ連載の続編で、推測統計(区間推定・仮説検定)に焦点を当てています。身近に使える表計算ソフト(ExcelやGoogleスプレッドシート)を利用。数学などの前提知識は不要です。
もはやAIや機械学習の実践に高度な知識は必要ない?! 前提知識ができるだけ不要で、誰でも簡単に試せるAIや機械学習をコンパクトに紹介する。手元で実際に動かし、その面白さや特徴、利点/欠点を体感しよう。
「今、画像生成AIがはやっているみたいだけど、何ができて、何がすごいのかよく分からない」という普通の人に向けて、Stable Diffusionの概要と基本的な仕組み、それを簡単に使うためのサービスなどをできるだけ分かりやすくコンパクトに紹介する連載。
「Python入門」に続くPython学習シリーズ。「Pythonは覚えたけど、次は何を学んで、どうやって膨大な量のデータを処理したらいいの?」という方に向けて、NumPy/pandas/Matplotlibといったライブラリの使い方や、それらを使って実際にデータ処理を行う方法を説明する連載。
AI・機械学習・ディープラーニングを始めるが、プログラミングについてまったく初めての人に向けて、その作業環境の選択指針やお薦めの「Jupyter Notebook」のオンライン版「Google Colaboratory」の基本的な使い方を分かりやすく紹介する連載。
「機械学習は難しそう」と思っていませんか? 心配は要りません。この連載では、「知識ゼロから学べる」をモットーに、機械学習の基礎と各手法を図解と簡潔な説明で分かりやすく解説します。Pythonを使った実践演習もありますので、自分の手を動かすことで実用的なスキルを身に付けられます。
機械学習の数学は難しい!? そう思っている人はこの連載から学んでみよう。サブタイトルは「― 中学/高校数学のキホンから学べる」。本連載では、小学校で習う「四則演算(足し算/引き算/掛け算/割り算)」を使って、機械学習の数学をできるだけ分かりやすく簡単に説明していく。
中学や高校で学んだ数学を題材にして、Pythonによる数学×プログラミングを学んでみよう。数学の教科書に載っている定理や公式だけに限らず、興味深い数式の例やAI/機械学習の基本となる例を取り上げながら、数学的な考え方を背景としてプログラミングを学べる連載。
AI・機械学習・ディープラーニングを始めるが、Pythonプログラミングも初めての人に向けて、Pythonでデータを取り扱うための基礎知識として、「リスト」や「NumPy」「数学のテンソル」について分かりやすく紹介する連載。
ニューラルネットワークの仕組みや挙動を、数学理論からではなく、Pythonコードから理解しよう。フルスクラッチでニューラルネットワーク(DNN:Deep Neural Network)を実装していく。
機械学習の勉強はここから始めてみよう。ディープラーニングの基盤技術であるニューラルネットワーク(NN)を、知識ゼロの状態から概略を押さえつつ実装。さらにCNNやRNNも同様に学ぶ。これらの実装例を通して、TensorFlow 2とKerasにも習熟する連載。
PyTorchの勉強はシンプルなニューラルネットワーク(NN)を実装することから始めてみよう。まずはニューロンのモデル定義から始め、フィードフォワードとバックプロパゲーション、PyTorchテンソルの基礎、データローダー、最適化、評価まで一通りを解説。さらにCNNやRNNの実装例を通して、PyTorchにも習熟する連載。
TensorFlowを使ってディープラーニングの基礎が体験できる連載。TensorFlowの概要から、インストール方法、CNN/RNNモデルの実装体験、TensorBoardの使い方までを解説する。
リクルートにおける数理最適化の応用事例の紹介を通じて、数理最適化とは何か、どのようにビジネスに応用できるのかを紹介する連載。
精度向上により、近年利用が広まっている「ニューラル機械翻訳」。その仕組みを、自分で動かしながら学んでみましょう。
データ分析/機械学習の競技大会プラットフォーム「Kaggle」についての初心者向け連載。コンペティションの内容から、事例に基づくノウハウ、実際にメダルを受賞してKaggle Masterになるための道標を示す。
Kaggle初心者がKaggleに挑戦した過程や得られた知見などを記事化していく連載。執筆者と読者が初心者レベル同士だからこそできる意見効果/悩み共有/情報提供を行っていきます。
AIやデータサイエンス、場合によってはもっと広げてPythonなどの幅広い技術を活用して、業務データの利活用や日常作業の効率化、身の回りの趣味や遊びの高度化などを試していく連載。