在 Python 中执行 Chi-Square 检验
Preet Sanghavi
2022年5月17日
卡方检验用于确定两个分类数据变量之间的独立性。我们将在本教程中使用 SciPy
模块在 Python 中执行此测试。
我们将使用 SciPy 模块中的 chi2_contingency()
函数来执行测试。让我们从导入 SciPy
模块开始。
在 Python 中执行卡方检验
导入 SciPy:
from scipy.stats import chi2_contingency
chi2_contingency
函数将二维格式的列联表作为输入。统计中使用列联表来总结分类变量之间的关系。
所以让我们创建这个列联表。
data = [[207, 282, 241], [234, 242, 232]]
让我们将这个数组传递给函数。
stat, p, dof1, expected = chi2_contingency(data)
chi2_contingency()
函数将返回一个元组,其中包含测试统计信息、p 值、自由度和预期表。我们将获得的 p 值与 0.05 的 alpha 值进行比较。
现在让我们使用下面的代码来解释 p 值。
alpha = 0.05
print("p val is " + str(p))
if p <= alpha:
print('Dependent')
else:
print('Independent')
上述代码的输出将是:
p val is 0.1031971404730939
Independent
如果 p 值大于 alpha 值(即 0.05),则两个变量没有显着相关性,可以认为是独立的。
在我们的例子中,我们有一个大于 alpha 的 p 值,因此我们可以得出结论,我们的两个变量都是独立的。因此,我们可以使用上述技术在 Python 中执行卡方检验。
Author: Preet Sanghavi