问题：

您可以将熊猫df.str.replace（）函数用于多个值吗？

商和颂

2023-03-14

我正在使用pandasdf.str.replace（）函数，希望从字符串中删除多个字符。

我正在尝试使用< code>pandas清理CSV文件中的一些交易数据。我有一个以< code>Object数据类型存储交易金额的列。在将它更改为< code>float数据类型之前，我需要从大于< code>999.99的数字中删除< code>$字符和任何< code >，字符。我可以一次做一个。但是，我想知道是否可以传入多个值来清理它。

2 8/20/2019犹他谷大学犹他谷本科UVU PMT 1 908191 4825.50

df['Amount'] = df['Amount'].str.replace(r',','').astype(float)

如果可能的话，我想同时删除“$”和，“”字符。

共有2个答案

阎宝

2023-03-14

去偷政治学家的评论，并用一点解释来回答。

使用一些虚假数据：

import pandas as pd
import numpy as np

np.random.seed(1)

df = pd.DataFrame(np.random.randint(5, 100, size=(5,)), columns=['amount']).applymap(str)

df.amount = '$' + df.amount + ',' + '000'

print(df)

    amount
0  $42,000
1  $17,000
2  $77,000
3  $14,000
4  $80,000

我们的< code >金额列中有< code>$和< code >，。使用

df.amount.str.replace(r'\$|\,', '').astype(float)

我们得到

0    42000.0
1    17000.0
2    77000.0
3    14000.0
4    80000.0
Name: amount, dtype: float64

为什么？默认情况下，str.replace（）方法具有参数regex=True，这意味着它接受用于模式匹配的正则表达式。

字符串前面的r告诉代码将字符串读取为“原始”
\$说要寻找美元符号
|是或
\，说要查找逗号

在< code>\$和< code>\，之间使用< code>|(不带空格！)意味着查找其中一个，并用方法中第二个参数中的内容替换它们(也称为< code>repl)

下面是我发现的一个备忘单，它解释了其他正则表达式字符以及如何使用它们：正则表达式教程-示例快速备忘单

赵炯

2023-03-14

冒昧地从@Ian借用DataFrame

还有另一种方法可以使用替换方法，并使用ng替换使用cript方法替换列中的多个值。

>>> df
    amount
0  $25,000
1  $13,000
2  $65,000
3  $19,000
4  $15,000

它将简单地删除＜code＞$

>>> df['amount'].replace({'\$': '', ',': ''}, regex=True)
0    25000
1    13000
2    65000
3    19000
4    15000
Name: amount, dtype: object

只需使用< code>astype将值转换为float..

>>> df['amount'].replace({'\$': '', ',': ''}, regex=True).astype(float)
0    25000.0
1    13000.0
2    65000.0
3    19000.0
4    15000.0
Name: amount, dtype: float64

您可以将熊猫df.str.replace（）函数用于多个值吗？

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档