Pandas DataFrame.corr()函式
Minahil Noor
2023年1月30日
2021年1月22日
-
pandas.DataFrame.corr()
語法 -
示例程式碼:
DataFrame.corr()
方法使用pearson
方法查詢相關矩陣 -
示例程式碼:
DataFrame.corr()
方法使用kendall
方法查詢相關矩陣 -
示例程式碼:
DataFrame.corr()
方法使用 Spearman 方法和更多列值對查詢相關矩陣
Python Pandas DataFrame.corr()
函式查詢 DataFrame 各列之間的相關性。
pandas.DataFrame.corr()
語法
DataFrame.corr(method='pearson',
min_periods=1)
引數
method |
相關的方法。它可以是 pearson 、kendall 和 pearman 。pearson 是預設值。 |
min_periods |
該引數規定了每對列所需的最少觀測次數,以獲得有效結果。目前只適用於 pearson 和 pearman 相關。 |
返回
它返回帶有計算出的列間相關性的 Dataframe。
示例程式碼:DataFrame.corr()
方法使用 pearson
方法查詢相關矩陣
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)
輸出:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.00000 -0.61515
Obtained Marks -0.61515 1.00000
函式已返回了相關矩陣。它忽略了非數字列。它使用 pearson
方法和一對列值(min_position=1
)計算了相關性。
示例程式碼:DataFrame.corr()
方法使用 kendall
方法查詢相關矩陣
使用 Kendall 方法尋找相關性,我們將呼叫 corr()
函式來使用 method= "kendall"
。
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)
輸出:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.4
Obtained Marks -0.4 1.0
函式返回了相關矩陣。它使用 Kendall 方法和一對列值(min_position= 1
)計算了相關性。
示例程式碼:DataFrame.corr()
方法使用 Spearman 方法和更多列值對查詢相關矩陣
現在我們將使用 pearsman
方法將 min_periods
的值設定為 2
。引數 min_periods
只適用於 pearson
和 pearman
方法。
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)
輸出:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.5
Obtained Marks -0.5 1.0
現在,該函式已使用 2 對列值計算了相關性。