在 Python 中执行 Chi-Square 检验

Preet Sanghavi 2022年5月17日
在 Python 中执行 Chi-Square 检验

卡方检验用于确定两个分类数据变量之间的独立性。我们将在本教程中使用 SciPy 模块在 Python 中执行此测试。

我们将使用 SciPy 模块中的 chi2_contingency() 函数来执行测试。让我们从导入 SciPy 模块开始。

在 Python 中执行卡方检验

导入 SciPy:

from scipy.stats import chi2_contingency

chi2_contingency 函数将二维格式的列联表作为输入。统计中使用列联表来总结分类变量之间的关系。

所以让我们创建这个列联表。

data = [[207, 282, 241], [234, 242, 232]]

让我们将这个数组传递给函数。

stat, p, dof1, expected = chi2_contingency(data)

chi2_contingency() 函数将返回一个元组,其中包含测试统计信息、p 值、自由度和预期表。我们将获得的 p 值与 0.05 的 alpha 值进行比较。

现在让我们使用下面的代码来解释 p 值。

alpha = 0.05
print("p val is " + str(p))
if p <= alpha:
	print('Dependent')
else:
	print('Independent')

上述代码的输出将是:

p val is 0.1031971404730939
Independent

如果 p 值大于 alpha 值(即 0.05),则两个变量没有显着相关性,可以认为是独立的。

在我们的例子中,我们有一个大于 alpha 的 p 值,因此我们可以得出结论,我们的两个变量都是独立的。因此,我们可以使用上述技术在 Python 中执行卡方检验。

Preet Sanghavi avatar Preet Sanghavi avatar

Preet writes his thoughts about programming in a simplified manner to help others learn better. With thorough research, his articles offer descriptive and easy to understand solutions.

LinkedIn GitHub