検索
連載

[AI・機械学習の数学]総和を表すΣは機械学習に必須の記号AI・機械学習の数学入門(4/5 ページ)

「Σ」を理解して総和をマスターしよう。応用で、Σの公式を使って平均を求めてみる(最小二乗法につながる基礎知識)。さらに、平均を使って重心を求める計算も行う(クラスタリング「k-means法」につながる基礎知識)。

Share
Tweet
LINE
Hatena

応用:Σを使って平均値を求める式を導き出す

 前回、具体的な数値を使って、各データとの距離の二乗和が最小になるときの

の値こそが平均値である、というお話をしました。また平均値の話か、と思われた方もおられるかもしれませんが、前ページで示した目標【その2】の公式を使ったΣの計算に慣れるのに恰好(かっこう)のネタなので、少しお付き合いください。また、新たな気づきも得られるはずです。

 さて、今回は、数値の代わりに文字を使い、総和をΣで表してみます。そうすれば、平均値を求める式を一般的に表すことができそうですね。そこで、各データを{x1,x2, ... , xn}とし、各データとの距離の二乗和が最小になるときの値を

として、

を求める式を導き出してみましょう。

 図で表すと、以下の

を求めるということです(図3)。なお、2乗の総和のことを「二乗和(じじょうわ)」と略して呼びます。ここからは動画でも分かりやすく解説しているので、難しく感じた人は次の動画2を視聴してみてください。

動画2 距離の二乗和を最小にする「xバー」を求める(総和Σ活用編)


各データからの距離の二乗和が最も小さくなる点を求める
図3 各データからの距離の二乗和が最も小さくなる点を求める

 では、前回と同じようにやってみましょう。まず、

します(=距離の2乗を求める)。そして、それらを全て足します(=総和を求める)。

です。ここで、Σを使ってこの式を書いてみてください。またまた穴埋めです。「どこから」「どこまで」は自明なので省略しちゃいましょう。

 答えは以下の通りです。

 要するに、Σの中の式では、x1,x2,...,xnを一般的にxiと表せばいい、ということですね。

Copyright© Digital Advantage Corp. All Rights Reserved.

[an error occurred while processing this directive]
ページトップに戻る