在 Pandas DataFrame 中按索引删除列

Manav Narula 2020年12月31日
在 Pandas DataFrame 中按索引删除列

DataFrame 可以非常大,可以包含数百行和数百列。熟练掌握 DataFrame 的基本维护操作是很有必要的,比如删除其中的多列。我们可以使用 dataframe.drop() 方法,根据指定的 axis 从 DataFrame 中删除列或行,0 代表行,1 代表列。它根据一些标签来确定要删除的元素。例如,我们将从下面的 DataFrame 中删除列'a'

import pandas as pd

df = pd.DataFrame([[10,6,7,8],
                   [1,9,12,14],
                   [5,8,10,6]],
                  columns = ['a','b','c','d'])

print(df)

df.drop(['a'], axis = 1, inplace = True)

print(df)

输出:

    a  b   c   d
0  10  6   7   8
1   1  9  12  14
2   5  8  10   6
   b   c   d
0  6   7   8
1  9  12  14
2  8  10   6

请注意 drop 函数中 inplace 参数的使用。当 inplace 参数设置为 True 时,列将从原始 DataFrame 中删除;否则,将返回原始 DataFrame 的副本。

在我们的例子中,我们已经删除了列'a',但我们需要将其标签名传递给 dataframe.drop() 函数。在处理大型数据集时,我们应该同时处理许多列的此类任务,并且使用列索引代替它们的名称。

我们可以通过使用 dataframe.columns() 方法来实现,该方法返回 DataFrame 的所有列,并使用它们的索引将所需的列标签传递给 dataframe.drop() 函数。下面的代码片段解释了我们如何做到这一点。

import pandas as pd

df = pd.DataFrame([[10,6,7,8],
                   [1,9,12,14],
                   [5,8,10,6]],
                  columns = ['a','b','c','d'])

df.drop(df.columns[[1,2]],
        axis = 1,
        inplace = True)

print(df)

输出:

    a   d
0  10   8
1   1  14
2   5   6

它将删除索引为 12 的列。

我们也可以避免使用 axis 参数,只需在 dataframe.drop() 函数中提到 columns 参数,它就会自动指示要删除的列。例子

import pandas as pd

df = pd.DataFrame([[10,6,7,8],
                   [1,9,12,14],
                   [5,8,10,6]], columns = ['a','b','c','d'])

df.drop(columns = df.columns[[1,2]],
        inplace = True)

print(df)

输出:

    a   d
0  10   8
1   1  14
2   5   6
Author: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

相关文章 - Pandas DataFrame