ミンコフスキー距離(Minkowski distance)/Lpノルムとは?AI・機械学習の用語辞典

用語「ミンコフスキー距離」について説明。2点間の距離を計測する方法の一つで、マンハッタン距離(L1ノルム)やユークリッド距離(L2ノルム)、チェビシェフ距離(L∞ノルム)などを一般化したもの。パラメーター「p」の値を調整することで柔軟に距離を表現できる。

» 2024年05月29日 05時00分 公開
[一色政彦デジタルアドバンテージ]
「AI・機械学習の用語辞典」のインデックス

連載目次

用語解説

 数学/統計学/機械学習におけるミンコフスキー距離Minkowski distance)とは、n次元ベクトルで表現される2点(例えばx=[x1,x2,...,xn]y=[y1,y2,...,yn])間の「距離(ノルム)」を計算するための方法の一つである(具体的な計算方法は後述する)。マンハッタン距離(L1ノルム)や、ユークリッド距離(L2ノルム)チェビシェフ距離(Lノルム)の計算を一般化したものとも見なせる。ミンコフスキー距離は、LpノルムLp norm)とも呼ばれる。

 図1は、さまざまなpの値における「Lpノルムの単位円(=全て点の距離が1になる円)」の形状を示している。これは、原点(中心、例えば点x)から1の距離にある点(例えば点y)を連続的に描いて線の図形にしたものだ。例えばp=2の場合、原点から1の距離にある点を満遍なく描いていくと、完全な円形になる(図1の2行1列目)。このように単位円を描くことで、「異なるpの値が、距離の計算方法にどのように影響するか」を視覚的に理解できる。

図1 ミンコフスキー距離のイメージ(さまざまなpの値におけるLpノルムの単位円の形状) 図1 ミンコフスキー距離のイメージ(さまざまなpの値におけるLpノルムの単位円の形状)

 図1を見ると分かるように、pの値が異なると、単位円の形が変わる。

  • 1行1列目: p=0.5の場合、単位円は星形のような形になる(一般的にはp≧1であるため、この例は特殊であることに注意)
  • 1行2列目: p=1の場合、単位円はひし形になる(マンハッタン距離)
  • 1行3列目: p=1.5の場合、単位円は丸みを帯びたひし形になる
  • 2行1列目: p=2の場合、単位円は完全な円形になる(ユークリッド距離)
  • 2行2列目: p=3の場合、単位円は丸みを帯びた正方形になる
  • 2行3列目: p=∞の場合、単位円は正方形になる(チェビシェフ距離)

「ミンコフスキー距離(Lpノルム)」の定義と数式

 点xから点yのミンコフスキー距離(Lpノルム)を求める数式は、以下のように定義できる。

 この数式では、2つのn次元ベクトルで各成分の差の絶対値を取り、それらの絶対値のp乗を合計し、その合計値の1/p乗(p分の1乗)を「距離」として採用している。pには基本的に1以上の実数を指定する。

 ||……||という数学記号は、ベクトル空間における「長さ/距離」を表現する概念であるノルムnorm)を意味する。Lpノルムは、pの値によって異なる種類の距離を表現する。前述した通り、p=1の場合はマンハッタン距離、p=2の場合はユークリッド距離、p=∞の場合はチェビシェフ距離となる。

 ちなみにLpノルムは、NumPyライブラリのnp.linalg.norm(<x-y点間距離の多次元配列データ>, ord=<pの値>)関数で計算できる。

pの値の調整について

 パラメーターpの値を調整することで、データ間の距離を柔軟に表現できる。例えば顧客をグループ分け(=機械学習のクラスタリング)する場合、データ間の類似性をミンコフスキー距離で評価する際には、データの特徴やクラスタリングの目的に合わせてpの値を調整することで、クラスタリングの精度を向上させることができる。

 ミンコフスキー距離は、p=1(マンハッタン距離)の場合には差が小さい成分も考慮するのに対し、p=∞(チェビシェフ距離)の場合には差が大きい成分のみを考慮するようになる。p=2(ユークリッド距離)の場合は、それらの中間ぐらいで各成分を考慮する。

「AI・機械学習の用語辞典」のインデックス

AI・機械学習の用語辞典

Copyright© Digital Advantage Corp. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。