Pythonで学ぶ「機械学習」入門 【知識ゼロでも大丈夫】

Pythonで学ぶ「機械学習」入門 【知識ゼロでも大丈夫】

デジタルアドバンテージ 一色 政彦

 「機械学習は難しそう」と思っていませんか? 心配は要りません。この連載では、「知識ゼロから学べる」をモットーに、機械学習の基礎と各手法を図解と簡潔な説明で分かりやすく解説します。Pythonを使った実践演習もありますので、自分の手を動かすことで実用的なスキルを身に付けられます。

第1回 機械学習をPythonで学ぼう! 基礎、できること、ライブラリ(2024/02/08)

  • 機械学習とは
    ・ルールベースと機械学習ベースの違い
     - ルールベースのアプローチ
     - 機械学習ベースのアプローチ
  • 機械学習の学習方法
    ・教師あり学習
    ・教師なし学習
    ・自己教師あり学習
    ・強化学習
  • 機械学習が解決できること
    ・解決できるタスクとは
    ・【教師あり学習】回帰(数値予測)
    ・【教師あり学習】分類
    ・【教師なし学習】クラスタリング(グループ分け)
    ・【教師なし学習】次元削減
  • 機械学習の基本用語
    ・機械学習モデルの入力と出力
    ・説明変数と目的変数
    ・特徴量とラベル
    ・パラメーターとハイパーパラメーター
    ・学習と訓練
    ・その他の用語
  • 機械学習の環境を準備しよう
    ・無料のクラウドを使用する場合【誰にもお勧め】
    ・【コラム】ローカルPCを使用する場合【本格的に始めたい人にお勧め】
  • 機械学習のライブラリを知ろう
    ・Python言語
    ・NumPy
    ・pandas
    ・Matplotlib
    ・seaborn
    ・scikit-learn
    ・実行環境のバージョンチェック
    ・【コラム】その他のプログラミング言語「R」「Julia」について
  • 実力試しクイズ

第2回 scikit-learn入門&使い方 ― 機械学習の流れを学ぼう(2024/04/11)

  • 0. 今回使用するデータセット
  • 1. サンプルデータを読み込んでみよう(pandas使用)
    ・読み込んだデータは、そのまま使えない?! 前処理の必要性
    ・【コラム】特徴量エンジニアリング
  • 2. 前処理:カテゴリー値を数値に置き換えよう(pandas使用)
  • 3. 前処理:欠損値がないか確認し、あれば対処しよう
    ・欠損値の有無を調べる(pandas使用)
    ・欠損値を処理する(pandas使用)
  • 4. 前処理:異常値がないか確認し、あれば対処しよう
    ・グラフから異常値を検出する(Matplotlib使用)
    ・統計量からも異常値を確認する(pandas使用)
  • 【応用テクニック】より洗練された可視化と数値計算
    ・より高度なグラフ描画(seaborn使用)
    ・【コラム】探索的データ分析で有用なseabornのpairplot
    ・より高速な数値計算(NumPy使用)
    ・【コラム】正規化や標準化を行うにはscikit-learnが便利
  • 5. 機械学習の準備:データを訓練用とテスト用に分割しよう(scikit-learn使用)
    ・検証用データセットも必要な理由
    ・【コラム】ホールドアウト検証と交差検証の違い
  • 6. 機械学習の実践:訓練〜予測〜評価しよう(scikit-learnの使い方)
  • 実力試しクイズ

第3回 「線形回帰」(数値予測)をPythonで学ぼう(2024/08/22)

  • 何の役に立つ手法?
    ・単回帰モデル
    ・重回帰モデル
    ・【コラム】回帰分析とは
    ・【コラム】線形回帰と非線形回帰の違い
    ・【注意】モデルが適用できる範囲
  • どんな仕組み?
    ・ステップ1: 訓練セットを準備
    ・ステップ2: 仮の回帰直線を設定
    ・ステップ3: 残差を計算
    ・ステップ4: 残差の二乗和(RSS)の計算
    ・ステップ5: 残差の二乗和(RSS)の最小化
    ・ステップ6: 最適な回帰直線の決定
  • 体験してみよう
    ・LinearRegressionクラスの使い方
    ・実際に使ってみよう: データセットの読み込み
    ・実際に使ってみよう: 機械学習モデルの訓練
    ・実際に使ってみよう: 訓練済みモデルによる予測
    ・モデルの評価と考察
  • 【発展】知っておくべき多重共線性の検出方法
    ・相関行列を用いる方法
    ・分散膨張係数(VIF)を用いる方法
  • 実力試しクイズ

第4回 「正則化」手法(ラッソ回帰、リッジ回帰)をPythonで学ぼう(2024/12/05)

  • 何の役に立つ手法?
    ・ラッソ回帰(L1正則化)
    ・リッジ回帰(L2正則化)
  • どんな仕組み?
    ・【前提知識】残差の二乗和(RSS)とは?
    ・正則化項とは?
    ・ラッソ回帰の正則化項
    ・リッジ回帰の正則化項
    ・ラッソ回帰とリッジ回帰がもたらす効果の違い
    ・【コラム】正則化項の「α」値の決め方
  • 体験してみよう
    ・LassoクラスとRidgeクラスの使い方
    ・ノートブックの利用について
    ・実際に使ってみよう: データセットの作成
    ・実際に使ってみよう: 機械学習モデルの訓練
    ・実際に使ってみよう: 訓練済みモデルによる予測
    ・モデルの評価と考察
  • 【発展】ハイパーパラメーターのチューニング(初級編)
    ・GridSearchCVクラスを用いる方法
  • 実力試しクイズ
スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。