在 Python 中執行 Chi-Square 檢驗

Preet Sanghavi 2022年5月17日
在 Python 中執行 Chi-Square 檢驗

卡方檢驗用於確定兩個分類資料變數之間的獨立性。我們將在本教程中使用 SciPy 模組在 Python 中執行此測試。

我們將使用 SciPy 模組中的 chi2_contingency() 函式來執行測試。讓我們從匯入 SciPy 模組開始。

在 Python 中執行卡方檢驗

匯入 SciPy:

from scipy.stats import chi2_contingency

chi2_contingency 函式將二維格式的列聯表作為輸入。統計中使用列聯表來總結分類變數之間的關係。

所以讓我們建立這個列聯表。

data = [[207, 282, 241], [234, 242, 232]]

讓我們將這個陣列傳遞給函式。

stat, p, dof1, expected = chi2_contingency(data)

chi2_contingency() 函式將返回一個元組,其中包含測試統計資訊、p 值、自由度和預期表。我們將獲得的 p 值與 0.05 的 alpha 值進行比較。

現在讓我們使用下面的程式碼來解釋 p 值。

alpha = 0.05
print("p val is " + str(p))
if p <= alpha:
	print('Dependent')
else:
	print('Independent')

上述程式碼的輸出將是:

p val is 0.1031971404730939
Independent

如果 p 值大於 alpha 值(即 0.05),則兩個變數沒有顯著相關性,可以認為是獨立的。

在我們的例子中,我們有一個大於 alpha 的 p 值,因此我們可以得出結論,我們的兩個變數都是獨立的。因此,我們可以使用上述技術在 Python 中執行卡方檢驗。

Preet Sanghavi avatar Preet Sanghavi avatar

Preet writes his thoughts about programming in a simplified manner to help others learn better. With thorough research, his articles offer descriptive and easy to understand solutions.

LinkedIn GitHub