Table of Contents
Mahalanobis Distanceとは?
Def: Mahalanobis Distance
\[\pmb x_i \equiv (x_{1i}, x_{2i}, x_{3i}) \forall i \in (1, \cdots, N)\]と各観測対象 $i$ について確率変数ベクトルが観察されたとしまう. このとき, Maharalanobis Distance (MD) は以下のように定義される:
\[\begin{align*} MD =& \sqrt{(\pmb x_i - \bar{\pmb x})\pmb V^{-1}(\pmb x_i - \bar{\pmb x})^T}\\ \text{where } \ \ & \bar{\pmb x} \text{ : the vector of mean values of independent variables}\\ & \pmb V \text{ : the covariance matrix of independent variables} \end{align*}\]Euclidian distanceとの関係
\[ED = \sqrt{(\pmb x_i - \bar{\pmb x})(\pmb x_i - \bar{\pmb x})^T}\]Euclidian distance (ED)は上記のように表されるので, $\pmb V = I_k$のときMDとEDは一致することが定義からわかります. このことは, EDがすべての変数のウェイトを等しくした上で平均からの距離を計算している一方, MDは変数の分散や共分散を踏まえた上で平均からの距離を計算していることを示しています.
Euclidian distanceの問題点
(1) 距離がスケールに依存する
(2) 変数間の相関関係を考慮した距離にならない
References
関連ポスト
統計
Python
math
Linux
Ubuntu 20.04 LTS
Shell
English
git
方法論
Ubuntu 22.04 LTS
統計検定
競技プログラミング
フーリエ解析
前処理
SQL
coding
コミュニケーション
Network
ssh
将棋
Data visualization
Docker
Econometrics
VSCode
statistical inference
GitHub Pages
apt
development
システム管理
Coffee
cloud
数値計算
素数
Book
Font
Metrics
Poetry
Ubuntu 24.04 LTS
architecture
aws
shell
systemctl
テンプレート
データ構造
ポワソン分布
会計分析
文字コード
環境構築
論文
App
Bayesian
Dynamic Programming
Keyboard
Processing
R
Steam
filesystem
quarto
regex
(注意:GitHub Accountが必要となります)