Pandas DataFrame.corr()函数

Minahil Noor 2023年1月30日 2021年1月22日
  1. pandas.DataFrame.corr() 语法
  2. 示例代码:DataFrame.corr() 方法使用 pearson 方法查找相关矩阵
  3. 示例代码:DataFrame.corr() 方法使用 kendall 方法查找相关矩阵
  4. 示例代码:DataFrame.corr() 方法使用 Spearman 方法和更多列值对查找相关矩阵
Pandas DataFrame.corr()函数

Python Pandas DataFrame.corr() 函数查找 DataFrame 各列之间的相关性。

pandas.DataFrame.corr() 语法

DataFrame.corr(method='pearson', 
               min_periods=1)

参数

method 相关的方法。它可以是 pearsonkendallpearmanpearson 是默认值。
min_periods 该参数规定了每对列所需的最少观测次数,以获得有效结果。目前只适用于 pearsonpearman 相关。

返回

它返回带有计算出的列间相关性的 Dataframe。

示例代码:DataFrame.corr() 方法使用 pearson 方法查找相关矩阵

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)

输出:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance         1.00000        -0.61515
Obtained Marks    -0.61515         1.00000

函数已返回了相关矩阵。它忽略了非数字列。它使用 pearson 方法和一对列值(min_position=1)计算了相关性。

示例代码:DataFrame.corr() 方法使用 kendall 方法查找相关矩阵

使用 Kendall 方法寻找相关性,我们将调用 corr() 函数来使用 method= "kendall"

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)

输出:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.4
Obtained Marks        -0.4             1.0

函数返回了相关矩阵。它使用 Kendall 方法和一对列值(min_position= 1)计算了相关性。

示例代码:DataFrame.corr() 方法使用 Spearman 方法和更多列值对查找相关矩阵

现在我们将使用 pearsman 方法将 min_periods 的值设置为 2。参数 min_periods 只适用于 pearsonpearman 方法。

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)

输出:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.5
Obtained Marks        -0.5             1.0

现在,该函数已使用 2 对列值计算了相关性。

相关文章 - Pandas DataFrame