[AI・機械学習の数学]文字式を使いこなせば一気にレベルアップ:AI・機械学習の数学入門(3/3 ページ)
数字(1、2、3、……)の式の次は、文字(a、b、x、y、……)を使った式をおさらいしよう。これまでに学んだ知識と平方完成を使って、距離の二乗和の最小値を求める計算も行う。
解説:添字の利用
高校に入ると扱うデータの数や種類も増えてきます。しかし、アルファベットは26文字しかないので、100人のデータの平均を取るといった場合には、aとかbといった英字だけではうまく書けません。そこで、x1やx2といった書き方で各データを表します。こう書けば、同じ種類の値が幾つかあって、それらを番号で区別したいときに便利です。学生1、学生2、学生3のように番号で区別するのと同じです。
例えば、x1とx2とx3の平均値を求めるなら、
となります。この小さな1とか2とか3のことを「添字(そえじ)」と呼びます*4。x1の読み方は「エックスいち」です。場合によっては「エックスのいち」とか「エックスのいちばん」ということもあるかもしれません。もちろん、小さな字だからといって小さな声で読むなどという必要はありません(そんなことをする人はいないでしょうが)。なお、個々のデータのことを「要素」ということもあります。
添字を使えば、データがたくさんあっても1つの文字で複数の値が区別できますね。100人のデータの平均を求めるなら、以下のように表せます。
また、n人のデータの平均を求めるなら、以下のように表せます。
ここで、添字にも文字を使って表していることに注目してください。xnなら、xのn番目という意味になります。nは一般にデータの個数を表すのに使うことが多いので、最後の値(xn)ではなく「何番目か」の値を表したいときにはiやjなどを添字に使って表すのが一般的です。例えば、
のように書きます。iの値を変えれば好きな要素が指定できるというわけです。
ところで、n人の平均値を求める式の分子の方を見て何か気が付かないでしょうか。式を見ているだけだと気にならないかもしれませんが、この式を書け、と言われるとどうでしょう。いちいちx1+x2+ ... + xnと書くのはとても面倒ですね。1番のデータからn番のデータまでを合計するという決まり切った計算なので、もっと簡単に書きたいものです。
そこでいよいよ、Σ(シグマ)の登場です……と進みたいところなのですが、お話がかなり長くなってきたので、一応、予告だけということにして、詳しい説明は次回のお楽しみということにしましょう。
Σ、総和、つまり「全部足す」ということを表す記号ですが、機械学習のための計算でよく登場します。式の左辺は、Σが「全て足す」、下のi=1は「iの値は1から始める」、上のnは「iの値はnまで」、右のxiは、「xiを」ということになります。右辺のように長々と書く必要がなくなりますね。詳細については、次回ということで……。
文字式と文字式の計算の基本はここまでです。ホントに最低限ではありますが、これだけで十分先に進めます。このあとは少しだけ応用的な話題を取り上げ、文字式が問題解決に役立つことを見てみましょう。
各データとの距離の2乗の総和が最小になる値とは???
ここからは、文字式の計算に慣れるための練習をかねて、機械学習で使われる計算を少しだけ掘り下げて見ていきます(※これについては、計算過程を分かりやすく解説する音声解説付き動画も用意していますので、「難しい」と感じたら、ぜひ視聴してみてください)。
動画5 距離の二乗和を求める
問題:距離の二乗和の最小値を求める
Copyright© Digital Advantage Corp. All Rights Reserved.