在 Python 中计算马氏距离
本教程将介绍在 Python 中求两个 NumPy 数组之间的马氏距离的方法。
使用 Python 中 scipy.spatial.distance
库中的 cdist()
函数计算马氏距离
马氏距离是点与分布之间距离的度量。如果我们想找到两个数组之间的马氏距离,我们可以使用 Python 中 scipy.spatial.distance
库中的 cdist()
函数。cdist()
函数 计算两个集合之间的距离。我们可以在输入参数中指定 mahalanobis
来查找 Mahalanobis 距离。请参考以下代码示例。
import numpy as np
from scipy.spatial.distance import cdist
x = np.array([[[1,2,3],
[3,4,5],
[5,6,7]],
[[5,6,7],
[7,8,9],
[9,0,1]]])
i,j,k = x.shape
xx = x.reshape(i,j*k).T
y = np.array([[[8,7,6],
[6,5,4],
[4,3,2]],
[[4,3,2],
[2,1,0],
[0,1,2]]])
yy = y.reshape(i,j*k).T
results = cdist(xx,yy,'mahalanobis')
results = np.diag(results)
print (results)
输出:
[3.63263583 2.59094773 1.97370848 1.97370848 2.177978 3.04256456
3.04256456 1.54080605 2.58298363]
我们使用上述代码中的 cdist()
函数计算并存储了数组 x
和 y
之间的马氏距离。我们首先使用 np.array()
函数创建了两个数组。然后我们重新调整两个数组的形状并将转置保存在新数组 xx
和 yy
中。然后我们将这些新数组传递给 cdist()
函数,并在参数中使用 cdist(xx,yy,'mahalanobis')
指定 mahalanobis
。
在 Python 中使用 numpy.einsum()
方法计算马氏距离
我们还可以使用 numpy.einsum()
方法 计算两个数组之间的马氏距离。numpy.einsum()
方法用于评估输入参数的爱因斯坦求和约定。
import numpy as np
x = np.array([[[1,2,3],
[3,4,5],
[5,6,7]],
[[5,6,7],
[7,8,9],
[9,0,1]]])
i,j,k = x.shape
xx = x.reshape(i,j*k).T
y = np.array([[[8,7,6],
[6,5,4],
[4,3,2]],
[[4,3,2],
[2,1,0],
[0,1,2]]])
yy = y.reshape(i,j*k).T
X = np.vstack([xx,yy])
V = np.cov(X.T)
VI = np.linalg.inv(V)
delta = xx - yy
results = np.sqrt(np.einsum('nj,jk,nk->n', delta, VI, delta))
print(results)
输出:
[3.63263583 2.59094773 1.97370848 1.97370848 2.177978 3.04256456
3.04256456 1.54080605 2.58298363]
我们将数组传递给 np.vstack()
函数并将值存储在 X
中。之后,我们将 X
的转置传递给 np.cov()
函数并将结果存储在 V
中。然后我们计算了矩阵 V
的乘法逆矩阵,并将结果存储在 VI
中。我们计算了 xx
和 yy
之间的差异,并将结果存储在 delta
中。最后,我们使用 results = np.sqrt(np.einsum('nj,jk,nk->n', delta, VI, delta))
计算并存储了 x
和 y
之间的马氏距离。
Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.
LinkedIn