データ分析やAI予測の基本中の基本「回帰分析」「最小二乗法」の基礎をPythonコードと図で理解する「AI」エンジニアになるための「基礎数学」再入門(15)

AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載。今回は「回帰分析」「最小二乗法」について、図版とPythonコードを交えて解説します。

» 2021年12月03日 05時00分 公開
[西村圭介東京ITスクール]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す本連載『「AI」エンジニアになるための「基礎数学」再入門』。前回まではSeason1として基礎を学んできました。

Season1基礎編の学習範囲(連載第1回から再掲)

 今回からはSeason2、応用編として下記の範囲を学んでいきます。

Season2応用編の学習範囲(連載第1回から再掲)

 応用編初回のテーマは「最小二乗法」です。

データ分析やAI予測の基礎「回帰分析」とは、「最小二乗法」とは

 皆さんは「Microsoft Excel」などで「回帰分析」を行ったことはあるでしょうか。

図1

 経験のある方は必見です。今回の記事を読めばモデル(=予測線)がどのように生成されるかが理解できます。これまでなんとなくポチっとボタンを押すと引かれていた線が、どのような線なのかが気になってきませんか。

 なお、「回帰分析とは何ぞや?」という方のために説明すると、概要はこちらの通りです。

  • 量的データ(連載第2回参照)の予測を直線で行う手法
  • 図1は「アイスの販売個数」を「気温」を用いて予測する様子

 図1のような線があれば「明日は27度になるそうだ」と分かり、「明日は240個ほどアイスが売れそうだ」と予測できるわけです。

2点を通る直線

 まずは高校数学の内容から思い出してみましょう。図2のような2点を通る直線はどのように求めるか覚えていますか?

図2

 このように解きます。

 まず、仮の線を「y = ax + b」と置く。

 点A (1,1) から、「1 = a + b」が成り立つ【1】。

 点B (2,2) から、「2 = 2a + b」が成り立つ【2】。

 ここで、【1】から、「a = 1 - b」を?に代入すると、「b = 0」となる【3】。

 【3】を【1】に代入すると、「a = 1」となる。

 よって、点A、点Bを通る直線は、「y = x」となる。


 これは比較的簡単ですね。

3点ある場合(直線的ではない)どうする?

 では図3のような3点がある場合に、「全ての点の近くを通る線を求めよ」といわれたら、どのような線が適切でしょうか?

図3

 問いをもう少し具体化します。仮の線を「y = ax + b」とすると、先ほどのようにa,bの値が決まれば線が決定します。

 従って、「どのような線を描くか?」=「a,bの値はいくつか?」ということになります。それでは、a,bはどのように求めるのでしょうか?

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

AI for エンジニアリング
「サプライチェーン攻撃」対策
1P情シスのための脆弱性管理/対策の現実解
OSSのサプライチェーン管理、取るべきアクションとは
Microsoft & Windows最前線2024
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。