Mahalanobis Distance

意思決定とモデル精度の橋渡し 2/N

公開日: 2022-02-10
更新日: 2023-03-03

  Table of Contents

Mahalanobis Distanceとは?

Def: Mahalanobis Distance

\[\pmb x_i \equiv (x_{1i}, x_{2i}, x_{3i}) \forall i \in (1, \cdots, N)\]

と各観測対象 $i$ について確率変数ベクトルが観察されたとしまう. このとき, Maharalanobis Distance (MD) は以下のように定義される:

\[\begin{align*} MD =& \sqrt{(\pmb x_i - \bar{\pmb x})\pmb V^{-1}(\pmb x_i - \bar{\pmb x})^T}\\ \text{where } \ \ & \bar{\pmb x} \text{ : the vector of mean values of independent variables}\\ & \pmb V \text{ : the covariance matrix of independent variables} \end{align*}\]

Euclidian distanceとの関係

\[ED = \sqrt{(\pmb x_i - \bar{\pmb x})(\pmb x_i - \bar{\pmb x})^T}\]

Euclidian distance (ED)は上記のように表されるので, $\pmb V = I_k$のときMDとEDは一致することが定義からわかります. このことは, EDがすべての変数のウェイトを等しくした上で平均からの距離を計算している一方, MDは変数の分散や共分散を踏まえた上で平均からの距離を計算していることを示しています.

Euclidian distanceの問題点

(1) 距離がスケールに依存する

(2) 変数間の相関関係を考慮した距離にならない

References

関連ポスト



Share Buttons
Share on:

Feature Tags
Leave a Comment
(注意:GitHub Accountが必要となります)