[AI・機械学習の数学]総和を表すΣは機械学習に必須の記号:AI・機械学習の数学入門(4/5 ページ)
「Σ」を理解して総和をマスターしよう。応用で、Σの公式を使って平均を求めてみる(最小二乗法につながる基礎知識)。さらに、平均を使って重心を求める計算も行う(クラスタリング「k-means法」につながる基礎知識)。
応用:Σを使って平均値を求める式を導き出す
前回、具体的な数値を使って、各データとの距離の二乗和が最小になるときの
の値こそが平均値である、というお話をしました。また平均値の話か、と思われた方もおられるかもしれませんが、前ページで示した目標【その2】の公式を使ったΣの計算に慣れるのに恰好(かっこう)のネタなので、少しお付き合いください。また、新たな気づきも得られるはずです。
さて、今回は、数値の代わりに文字を使い、総和をΣで表してみます。そうすれば、平均値を求める式を一般的に表すことができそうですね。そこで、各データを{x1,x2, ... , xn}とし、各データとの距離の二乗和が最小になるときの値を
として、
を求める式を導き出してみましょう。
図で表すと、以下の
が
を求めるということです(図3)。なお、2乗の総和のことを「二乗和(じじょうわ)」と略して呼びます。ここからは動画でも分かりやすく解説しているので、難しく感じた人は次の動画2を視聴してみてください。
動画2 距離の二乗和を最小にする「xバー」を求める(総和Σ活用編)
では、前回と同じようにやってみましょう。まず、
します(=距離の2乗を求める)。そして、それらを全て足します(=総和を求める)。
です。ここで、Σを使ってこの式を書いてみてください。またまた穴埋めです。「どこから」「どこまで」は自明なので省略しちゃいましょう。
答えは以下の通りです。
要するに、Σの中の式では、x1,x2,...,xnを一般的にxiと表せばいい、ということですね。
Copyright© Digital Advantage Corp. All Rights Reserved.