如何將 Pandas DataFrame 的索引轉換為列
Asad Riaz
2023年1月30日
2020年3月28日
-
df.index
將索引新增為新列 -
使用帶有
rename axis
的reset_index
重新命名當前索引列名 -
set_index
方法將列轉換為索引 -
MultiIndex
可在column
上設定indexs
的多層索引
我們將介紹將 Pandas DataFrame
的索引轉換為列的各種方法,例如 df.index
,帶有 rename_axis
的 reset_index
來重新命名索引,以及 set_index
。
我們還將介紹如何將多索引應用於具有多層索引的給定 DataFrame
。
df.index
將索引新增為新列
將索引新增為列的最簡單方法是將 df.index
作為新列新增到 DataFrame
。
考慮以下程式碼:
# python 3.x
import pandas as pd
df = pd.DataFrame([
(1,2,None),
(None,4,None),
(5,None,7),
(5,None,None)
],columns=['a','b','d'])
df['index'] = df.index
print(df)
輸出:
a b d index1
0 1.0 2.0 NaN 0
1 NaN 4.0 NaN 1
2 5.0 NaN 7.0 2
3 5.0 NaN NaN 3
使用帶有 rename axis
的 reset_index
重新命名當前索引列名
我們可以更改索引的名稱,然後將 reset_index
更改為一系列:
# python 3.x
import pandas as pd
df = pd.DataFrame([
(1,2,None),
(None,4,None),
(5,None,7),
(5,None,None)],
columns=['a','b','d'])
df = df.rename_axis('index').reset_index()
print(df)
輸出:
index a b d
0 0 1.0 2.0 NaN
1 1 NaN 4.0 NaN
2 2 5.0 NaN 7.0
3 3 5.0 NaN NaN
set_index
方法將列轉換為索引
我們可以使用 set_index
方法將任何列轉換為 index:
# python 3.x
import pandas as pd
df = pd.DataFrame([
(1,2,None),
(None,4,None),
(5,4,7),
(5,5,None)],
columns=['a','b','d'])
df.set_index('b',inplace=True)
print(df)
輸出:
a d
b
2 1.0 NaN
4 NaN NaN
4 5.0 7.0
5 5.0 NaN
或者,如果我們要刪除索引名,如原始檔案中那樣,則可以執行 df.index.name = None
:
# python 3.x
import pandas as pd
df = pd.DataFrame([
(1,2,None),
(None,4,None),
(5,4,7),
(5,5,None)
],columns=['a','b','d'])
df.set_index('b',inplace=True)
df.index.name = None
print(df)
輸出:
a d
2 1.0 NaN
4 NaN NaN
4 5.0 7.0
5 5.0 NaN
MultiIndex
可在 column
上設定 indexs
的多層索引
我們可以使用 MultiIndex.from_product()
函式建立一個 MultiIndex
,如下所示:
# python 3.x
import pandas as pd
import numpy as np
index = pd.MultiIndex.from_product([
['Burger', 'Steak', 'Sandwich'],
['Half', 'Full']],
names=['Item', 'Type'])
df = pd.DataFrame(index=index,
data=np.random.randint
(0, 10, (6,4)),
columns=list('abcd'))
print(df)
輸出:
a b c d
Item Type
Burger Half 0 3 9 1
Full 2 2 0 5
Steak Half 8 4 5 5
Full 5 8 0 7
Sandwich Half 2 8 9 5
Full 4 4 5 9