如何在 Pandas DataFrame 中重新命名列
Puneet Dobhal
2023年1月30日
2020年6月9日
-
使用
DataFrame.columns
方法重新命名 Pandas DataFrame 中的列 -
使用
DataFrame.rename()
方法重新命名 Pandas DataFrame 中的列 -
使用
DataFrame.set_axis()
方法重新命名 Pandas DataFrame 中的列
通常,我們需要在資料分析中操作列名。在本文中,我們將探索不同的方法來為已定義的 panadas DataFrame 操縱/重新命名列名。
使用 DataFrame.columns
方法重新命名 Pandas DataFrame 中的列
此方法非常簡單,可讓你直接重新命名列。我們可以使用 DataFrame.columns
屬性分配一個新的列名列表,如下所示:
import pandas as pd
example_df = pd.DataFrame([
['John', 20, 45],
['Peter', 21, 62],
['Scot', 25, 68]],
index=[0, 1, 2],
columns=['Name', 'Age', 'Marks'])
print"\nOriginal DataFrame"
print(pd.DataFrame(example_df))
example_df.columns = ['Name','Age','Roll_no']
print"\nModified DataFrame"
print(pd.DataFrame(example_df))
輸出:
Original DataFrame
Name Age Marks
0 John 20 45
1 Peter 21 62
2 Scot 25 68
Modified DataFrame
Name Age Roll_no
0 John 20 45
1 Peter 21 62
2 Scot 25 68
這種方法的一個缺點是,即使只需要重新命名一列,也必須列出整個列。當你有大量列時,指定整個列列表將變得不切實際。
使用 DataFrame.rename()
方法重新命名 Pandas DataFrame 中的列
前一種方法的替代方法是使用 DataFrame.rename()
方法。當我們不需要重新命名所有列時,此方法非常方便。
我們需要將舊列名稱指定為鍵,將新名稱指定為值。
import pandas as pd
example_df = pd.DataFrame([['John', 20, 45, 78],
['Peter', 21, 62, 68],
['Scot', 25, 68, 95]],
index=[0, 1, 2],
columns=['Name', 'Age', 'Marks','Roll_no'])
print"\nOriginal DataFrame"
print(pd.DataFrame(example_df))
example_df.rename(columns={'Marks': 'Roll_no',
'Roll_no': 'Marks'}, inplace=True)
print"\nModified DataFrame"
print(pd.DataFrame(example_df))
輸出:
Original DataFrame
Name Age Marks Roll_no
0 John 20 45 78
1 Peter 21 62 68
2 Scot 25 68 95
Modified DataFrame
Name Age Roll_no Marks
0 John 20 45 78
1 Peter 21 62 68
2 Scot 25 68 95
此方法的最大優點是你可以指定任意多的列。當你需要重新命名特定的列時,這是非常有效的,並且與以前的方法不同,不需要為 DataFrame
列出整個列列表。
你可能會注意到,在 DataFrame.rename()
函式呼叫中,我們已將 inplace
引數指定為 True
。inplace
引數預設為 False
,它指定是否返回新的 Pandas DataFrame。
將其指定為 True
表示函式呼叫不會返回新的 Pandas DataFrame
,而是會更改現有的 DataFrame
。
使用 DataFrame.set_axis()
方法重新命名 Pandas DataFrame 中的列
這是重新命名 Pandas DataFrame
列的另一種便捷方法。使用此方法時,我們必須指定整個列列表。
import pandas as pd
example_df = pd.DataFrame([['John', 20, 45, 78],
['Peter', 21, 62, 68],
['Scot', 25, 68, 95]],
index=[0, 1, 2],
columns=['Name', 'Age', 'Marks','Roll_no'])
print"\nOriginal DataFrame"
print(pd.DataFrame(example_df))
example_df.set_axis(['Name', 'Age', 'Roll_no','Marks'],
axis='columns', inplace=True)
print"\nModified DataFrame"
print(pd.DataFrame(example_df))
輸出:
Original DataFrame
Name Age Marks Roll_no
0 John 20 45 78
1 Peter 21 62 68
2 Scot 25 68 95
Modified DataFrame
Name Age Roll_no Marks
0 John 20 45 78
1 Peter 21 62 68
2 Scot 25 68 95