在 Python 中執行 Chi-Square 檢驗
Preet Sanghavi
2022年5月17日
卡方檢驗用於確定兩個分類資料變數之間的獨立性。我們將在本教程中使用 SciPy
模組在 Python 中執行此測試。
我們將使用 SciPy 模組中的 chi2_contingency()
函式來執行測試。讓我們從匯入 SciPy
模組開始。
在 Python 中執行卡方檢驗
匯入 SciPy:
from scipy.stats import chi2_contingency
chi2_contingency
函式將二維格式的列聯表作為輸入。統計中使用列聯表來總結分類變數之間的關係。
所以讓我們建立這個列聯表。
data = [[207, 282, 241], [234, 242, 232]]
讓我們將這個陣列傳遞給函式。
stat, p, dof1, expected = chi2_contingency(data)
chi2_contingency()
函式將返回一個元組,其中包含測試統計資訊、p 值、自由度和預期表。我們將獲得的 p 值與 0.05 的 alpha 值進行比較。
現在讓我們使用下面的程式碼來解釋 p 值。
alpha = 0.05
print("p val is " + str(p))
if p <= alpha:
print('Dependent')
else:
print('Independent')
上述程式碼的輸出將是:
p val is 0.1031971404730939
Independent
如果 p 值大於 alpha 值(即 0.05),則兩個變數沒有顯著相關性,可以認為是獨立的。
在我們的例子中,我們有一個大於 alpha 的 p 值,因此我們可以得出結論,我們的兩個變數都是獨立的。因此,我們可以使用上述技術在 Python 中執行卡方檢驗。
Author: Preet Sanghavi