Mahalanobis Distance

Table of Contents

Mahalanobis Distanceとは？
- Euclidian distanceとの関係
- Euclidian distanceの問題点
References

Mahalanobis Distanceとは？

Def: Mahalanobis Distance

\[\pmb x_i \equiv (x_{1i}, x_{2i}, x_{3i}) \forall i \in (1, \cdots, N)\]

と各観測対象 $i$ について確率変数ベクトルが観察されたとしまう. このとき, Maharalanobis Distance (MD) は以下のように定義される:

\[\begin{align*} MD =& \sqrt{(\pmb x_i - \bar{\pmb x})\pmb V^{-1}(\pmb x_i - \bar{\pmb x})^T}\\ \text{where } \ \ & \bar{\pmb x} \text{ : the vector of mean values of independent variables}\\ & \pmb V \text{ : the covariance matrix of independent variables} \end{align*}\]

Euclidian distanceとの関係

\[ED = \sqrt{(\pmb x_i - \bar{\pmb x})(\pmb x_i - \bar{\pmb x})^T}\]

Euclidian distance (ED)は上記のように表されるので, $\pmb V = I_k$のときMDとEDは一致することが定義からわかります. このことは, EDがすべての変数のウェイトを等しくした上で平均からの距離を計算している一方, MDは変数の分散や共分散を踏まえた上で平均からの距離を計算していることを示しています.

Euclidian distanceの問題点

(1) 距離がスケールに依存する

(2) 変数間の相関関係を考慮した距離にならない

References

関連ポスト

Ryo’s Tech Blog > 機械学習モデル精度の評価

Share Buttons
Share on:

Feature Tags
Leave a Comment
(注意：GitHub Accountが必要となります）

意思決定とモデル精度の橋渡し 2/N

Mahalanobis Distanceとは？

Euclidian distanceとの関係

Euclidian distanceの問題点

References

CONTENTS