AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載。今回は「回帰分析」「最小二乗法」について、図版とPythonコードを交えて解説します。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す本連載『「AI」エンジニアになるための「基礎数学」再入門』。前回まではSeason1として基礎を学んできました。
今回からはSeason2、応用編として下記の範囲を学んでいきます。
応用編初回のテーマは「最小二乗法」です。
皆さんは「Microsoft Excel」などで「回帰分析」を行ったことはあるでしょうか。
経験のある方は必見です。今回の記事を読めばモデル(=予測線)がどのように生成されるかが理解できます。これまでなんとなくポチっとボタンを押すと引かれていた線が、どのような線なのかが気になってきませんか。
なお、「回帰分析とは何ぞや?」という方のために説明すると、概要はこちらの通りです。
図1のような線があれば「明日は27度になるそうだ」と分かり、「明日は240個ほどアイスが売れそうだ」と予測できるわけです。
まずは高校数学の内容から思い出してみましょう。図2のような2点を通る直線はどのように求めるか覚えていますか?
このように解きます。
まず、仮の線を「y = ax + b」と置く。
点A (1,1) から、「1 = a + b」が成り立つ【1】。
点B (2,2) から、「2 = 2a + b」が成り立つ【2】。
ここで、【1】から、「a = 1 - b」を?に代入すると、「b = 0」となる【3】。
【3】を【1】に代入すると、「a = 1」となる。
よって、点A、点Bを通る直線は、「y = x」となる。
これは比較的簡単ですね。
では図3のような3点がある場合に、「全ての点の近くを通る線を求めよ」といわれたら、どのような線が適切でしょうか?
問いをもう少し具体化します。仮の線を「y = ax + b」とすると、先ほどのようにa,bの値が決まれば線が決定します。
従って、「どのような線を描くか?」=「a,bの値はいくつか?」ということになります。それでは、a,bはどのように求めるのでしょうか?
Copyright © ITmedia, Inc. All Rights Reserved.