Pandas DataFrame.corr()函式

Minahil Noor 2023年1月30日 2021年1月22日
  1. pandas.DataFrame.corr() 語法
  2. 示例程式碼:DataFrame.corr() 方法使用 pearson 方法查詢相關矩陣
  3. 示例程式碼:DataFrame.corr() 方法使用 kendall 方法查詢相關矩陣
  4. 示例程式碼:DataFrame.corr() 方法使用 Spearman 方法和更多列值對查詢相關矩陣
Pandas DataFrame.corr()函式

Python Pandas DataFrame.corr() 函式查詢 DataFrame 各列之間的相關性。

pandas.DataFrame.corr() 語法

DataFrame.corr(method='pearson', 
               min_periods=1)

引數

method 相關的方法。它可以是 pearsonkendallpearmanpearson 是預設值。
min_periods 該引數規定了每對列所需的最少觀測次數,以獲得有效結果。目前只適用於 pearsonpearman 相關。

返回

它返回帶有計算出的列間相關性的 Dataframe。

示例程式碼:DataFrame.corr() 方法使用 pearson 方法查詢相關矩陣

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)

輸出:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance         1.00000        -0.61515
Obtained Marks    -0.61515         1.00000

函式已返回了相關矩陣。它忽略了非數字列。它使用 pearson 方法和一對列值(min_position=1)計算了相關性。

示例程式碼:DataFrame.corr() 方法使用 kendall 方法查詢相關矩陣

使用 Kendall 方法尋找相關性,我們將呼叫 corr() 函式來使用 method= "kendall"

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)

輸出:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.4
Obtained Marks        -0.4             1.0

函式返回了相關矩陣。它使用 Kendall 方法和一對列值(min_position= 1)計算了相關性。

示例程式碼:DataFrame.corr() 方法使用 Spearman 方法和更多列值對查詢相關矩陣

現在我們將使用 pearsman 方法將 min_periods 的值設定為 2。引數 min_periods 只適用於 pearsonpearman 方法。

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)

輸出:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.5
Obtained Marks        -0.5             1.0

現在,該函式已使用 2 對列值計算了相關性。

相關文章 - Pandas DataFrame