［AI・機械学習の数学］文字式を使いこなせば一気にレベルアップ：AI・機械学習の数学入門（3/3 ページ）

» 2020年03月30日 05時00分公開

解説：添字の利用

　高校に入ると扱うデータの数や種類も増えてきます。しかし、アルファベットは26文字しかないので、100人のデータの平均を取るといった場合には、aとかbといった英字だけではうまく書けません。そこで、x₁やx₂といった書き方で各データを表します。こう書けば、同じ種類の値が幾つかあって、それらを番号で区別したいときに便利です。学生1、学生2、学生3のように番号で区別するのと同じです。

　例えば、x₁とx₂とx₃の平均値を求めるなら、

となります。この小さな₁とか₂とか₃のことを「添字（そえじ）」と呼びます*4。x₁の読み方は「エックスいち」です。場合によっては「エックスのいち」とか「エックスのいちばん」ということもあるかもしれません。もちろん、小さな字だからといって小さな声で読むなどという必要はありません（そんなことをする人はいないでしょうが）。なお、個々のデータのことを「要素」ということもあります。

*4　プログラミングでは、小さな文字の入力が面倒なので[]や()で囲んで表します。一般に、1からではなく0から始めた方が何かと都合がいいので、xの先頭の要素から3つ足す場合、例えば、

のような書き方になります。また、添字と呼ばずにインデックスと呼ぶことがよくあります。

　添字を使えば、データがたくさんあっても1つの文字で複数の値が区別できますね。100人のデータの平均を求めるなら、以下のように表せます。

　また、n人のデータの平均を求めるなら、以下のように表せます。

　ここで、添字にも文字を使って表していることに注目してください。x_nなら、xのn番目という意味になります。nは一般にデータの個数を表すのに使うことが多いので、最後の値（x_n）ではなく「何番目か」の値を表したいときにはiやjなどを添字に使って表すのが一般的です。例えば、

のように書きます。iの値を変えれば好きな要素が指定できるというわけです。

　ところで、n人の平均値を求める式の分子の方を見て何か気が付かないでしょうか。式を見ているだけだと気にならないかもしれませんが、この式を書け、と言われるとどうでしょう。いちいちx₁＋x₂＋ ... ＋ x_nと書くのはとても面倒ですね。1番のデータからn番のデータまでを合計するという決まり切った計算なので、もっと簡単に書きたいものです。

　そこでいよいよ、Σ（シグマ）の登場です……と進みたいところなのですが、お話がかなり長くなってきたので、一応、予告だけということにして、詳しい説明は次回のお楽しみということにしましょう。

　Σ、総和、つまり「全部足す」ということを表す記号ですが、機械学習のための計算でよく登場します。式の左辺は、Σが「全て足す」、下のi＝1は「iの値は1から始める」、上のnは「iの値はnまで」、右のx_iは、「x_iを」ということになります。右辺のように長々と書く必要がなくなりますね。詳細については、次回ということで……。

　文字式と文字式の計算の基本はここまでです。ホントに最低限ではありますが、これだけで十分先に進めます。このあとは少しだけ応用的な話題を取り上げ、文字式が問題解決に役立つことを見てみましょう。

各データとの距離の2乗の総和が最小になる値とは？？？

　ここからは、文字式の計算に慣れるための練習をかねて、機械学習で使われる計算を少しだけ掘り下げて見ていきます（※これについては、計算過程を分かりやすく解説する音声解説付き動画も用意していますので、「難しい」と感じたら、ぜひ視聴してみてください）。

動画5　距離の二乗和を求める

問題：距離の二乗和の最小値を求める

#CmsMembersControl .CmsMembersControlIn {width:100%;background:url(https://image.itmedia.co.jp/images/spacer.gif) #DDD;opacity:0.05;filter:progid:DXImageTransform.Microsoft.Alpha(Enabled=1,Style=0,Opacity=5);z-index:1;}