Pandas DataFrame DataFrame.replace()函数

Suraj Joshi 2023年1月30日 2020年11月7日
  1. pandas.DataFrame.replace() 语法
  2. 示例代码:使用 pandas.DataFrame.replace() 替换 DataFrame 中的值
  3. 示例代码:在 DataFrame 中使用 pandas.DataFrame.replace() 替换多个值
Pandas DataFrame DataFrame.replace()函数

pandas.DataFrame.replace() 用其他值替换 DataFrame 中的值,这些值可以是字符串、正则表达式、列表、字典、Series 或数字。

pandas.DataFrame.replace() 语法

DataFrame.replace(, 
                   to_replace=None, 
                   value=None, 
                   inplace=False, 
                   limit=None, 
                   regex=False, 
                   method='pad')

参数

to_replace 字符串,正则表达式,列表,字典,系列,数字或 None. 需要替换的 DataFrame 中的值。
value 标量,字典,列表,字符串,正则表达式或 None. 替换任何与 to_replace 匹配的值。
inplace 布尔值。如果为 True 修改调用者的 DataFrame
limit 整数。向前或向后填充的最大间隙大小
regex 布尔型。如果 to_replace 和/或 value 是一个正则表达式,则将 regex 设为 True
method 用于替换的方法

返回值

它返回一个 DataFrame,用给定的 value 替换所有指定的字段。

示例代码:使用 pandas.DataFrame.replace() 替换 DataFrame 中的值

import pandas as pd
df = pd.DataFrame({'X': [1, 2, 3,],
                   'Y': [4, 1, 8]})
print("Before Replacement")
print(df)  
replaced_df=df.replace(1, 5)
print("After Replacement")
print(replaced_df)

输出:

Before Replacement
   X  Y
0  1  4
1  2  1
2  3  8
After Replacement
   X  Y
0  5  4
1  2  5
2  3  8

这里,1 代表 to_replace 参数,5 代表 replace() 方法中的 value 参数。因此,在 df 中,所有值为 1 的元素都被 5 取代。

示例代码:在 DataFrame 中使用 pandas.DataFrame.replace() 替换多个值

使用列表替换

import pandas as pd
df = pd.DataFrame({'X': [1, 2, 3,],
                   'Y': [4, 1, 8]})
print("Before Replacement")
print(df)  
replaced_df=df.replace([1,2,3],[1,4,9])
print("After Replacement")
print(replaced_df)

输出:

Before Replacement
   X  Y
0  1  4
1  2  1
2  3  8
After Replacement
   X  Y
0  1  4
1  4  1
2  9  8

这里,[1,2,3] 代表 to_replace 参数,[1,4,9] 代表 replace() 方法中的 value 参数。因此,在 df 中,列 [1,2,3][1,4,9] 替换。

使用字典替换

import pandas as pd
df = pd.DataFrame({'X': [1, 2, 3,],
                   'Y': [3, 1, 8]})
print("Before Replacement")
print(df)  
replaced_df=df.replace({1:10,3:30})
print("After Replacement")
print(replaced_df)

输出:

Before Replacement
   X  Y
0  1  3
1  2  1
2  3  8
After Replacement
    X   Y
0  10  30
1   2  10
2  30   8

它将所有值为 1 的元素替换为 10,将所有值为 3 的元素替换为 30

使用 Regex 替换

import pandas as pd
df = pd.DataFrame({'X': ["zeppy", "amid", "amily"],
                   'Y': ["xar", "abc", "among"]})
print("Before Replacement")
print(df)  
df.replace(to_replace=r'^ami.$', value='song', regex=True,inplace=True)
print("After Replacement")
print(df)

输出:

Before Replacement
       X      Y
0  zeppy    xar
1   amid    abc
2  amily  among
After Replacement
       X      Y
0  zeppy    xar
1   song    abc
2  amily  among

它将所有前三个字符为 ami 然后后面跟任何一个字符的元素替换为 song。这里只有 amid 满足给定的正则表达式,因此只有 amidsong 替换。虽然 amily 的前三个字符是 ami,但 ami 后面还有两个字符。所以,amily 不满足给定的 regex,因此它保持一样,没被替换。如果你使用的是正则表达式,请确保 regex 设置为 True,并且 inplace=True 在调用 replace() 方法后修改原来的 DataFrame

Author: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

相关文章 - Pandas DataFrame