在 Pandas 中執行 T 檢驗
Preet Sanghavi
2022年5月16日
本教程將討論如何在 Pandas 中找到 T 檢驗值。
在 Pandas 中執行 T 檢驗的步驟
以下是在 Pandas 中執行 T 檢驗的步驟。
匯入相關庫
我們必須從 scipy.stats 匯入 Pandas 庫和 ttest_ind
才能開始。
import pandas as pd
from scipy.stats import ttest_ind
建立一個 Pandas DataFrame
讓我們建立一個示例 DataFrame 來對同一 DataFrame 執行 T 檢驗操作。
data = {'Category': ['type2','type1','type2','type1','type2','type1','type2','type1','type1','type1','type2'], 'values': [1,2,3,1,2,3,1,2,3,5,1]}
df = pd.DataFrame(data)
我們建立了一個 DataFrame,其中包含一個包含兩種類別的類別列,併為每個類別例項分配了一個值。
讓我們在下面檢視我們的 DataFrame。
print(df)
輸出:
Category values
0 type2 1
1 type1 2
2 type2 3
3 type1 1
4 type2 2
5 type1 3
6 type2 1
7 type1 2
8 type1 3
9 type1 5
10 type2 1
我們現在將使用以下程式碼為這兩種類別型別建立一個單獨的 DataFrame。此步驟有助於 T 檢驗查詢過程。
type1 = my_data[my_data['Category']=='type1']
type2 = my_data[my_data['Category']=='type2']
在 Pandas 中獲取 T 檢驗值
我們現在將找到 T 檢驗結果並使用 ttest_ind()
函式將它們儲存在一個變數中。我們通過以下方式使用此功能。
res = ttest_ind(type1['values'], type2['values'])
在上面的程式碼中,我們將 DataFrame 作為引數傳遞給函式,我們得到了 T 檢驗結果,包括一個具有 t 統計量和 p 值的元組。
現在讓我們列印 res
變數以檢視結果。
print(res)
輸出:
Ttest_indResult(statistic=1.4927289925706944, pvalue=0.16970867501294376)
在上面的輸出中,我們找到了具有 t 統計量和 p 值的 T 檢驗值。因此,我們可以通過上述方法成功找到 Pandas 中的 T 檢驗值。
Author: Preet Sanghavi