当前位置: 首页 > 面试题库 >

在熊猫中绕一列

景唯
2023-03-14
问题内容

有没有办法在熊猫中舍入单个列而不影响数据框的其余部分?

 df:
      item  value1  value2
    0    a    1.12     1.3
    1    a    1.50     2.5
    2    a    0.10     0.0
    3    b    3.30    -1.0
    4    b    4.80    -1.0

df.value1.apply(np.round)给出

0    1
1    2
2    0
3    3
4    5
5    5

使数据看起来像这样的正确方法是什么:

  item  value1  value2
0    a       1     1.3
1    a       2     2.5
2    a       0     0.0
3    b       3    -1.0
4    b       5    -1.0
5    c       5     5.0

问题答案:

你很亲密 您将此回合应用于给出的一系列值df.value1。因此,返回类型为Series。您需要将该系列分配回该数据框(或具有相同索引的另一个数据框)。

同样,有一种pandas.Series.round方法基本上是的简写pandas.Series.apply(np.round)

In[2]: 
    df.value1 = df.value1.round()
    print df

Out[2]:
    item  value1  value2
    0    a       1     1.3
    1    a       2     2.5
    2    a       0     0.0
    3    b       3    -1.0
    4    b       5    -1.0


 类似资料:
  • 我正在从pandas输出一个csv文件,其中包含一些用于latex报告的调查文本。一些响应在其响应中带有逗号,因此熊猫将数据输出为 通过将字段用双引号括起来,显然可以处理字段中的逗号。 我希望上面看起来像这样: 通过将所述字段包装在{}中,因为这是latex包可以理解的分隔符。 有没有办法告诉熊猫。要做这个吗? 我已经尝试了以下方法 当然,当我需要“}”时,它会用“{”关闭文本包装 更新当我使用p

  • 问题内容: 如问题所述,我有一个很大的数据框,但看起来像: 我试图摆脱文本数据,并将其替换为预定义的数值等效项。例如,在这种情况下,我想分别用或替换的或值。有没有一种方法无需我手动输入和更改值? 问题答案: / 上面的一个有趣的通用版本: 一切都不是。

  • 请考虑下表:对于每个代码,每一个状态都有一些值。 现在我想以这样的方式转置表,使成为列: 我不能让它工作,只转置那个特定的列。 在熊猫身上实现这一目标的好办法是什么?

  • 我想分配一个组的第一行。 输入: 我尝试了: 但是我只得到第一排。 我想要这样的输出:

  • 问题内容: 我 真的 很难尝试在中安装稳定的数据科学软件包配置。使用这样的主流相关工具应该更容易。 以下是 曾经 工作过的 Dockerfile ,有点 破译 ,将其从软件包核心中删除并单独安装,并指定了(因为据称更高版本与冲突)。 __ 上面的配置可以正常工作。 现在 发生的事情是构建确实可以通过,但是 导入失败 , 并出现以下错误: 自安装以来,我不知道哪个 正在尝试找到… 有谁知道如何为此获

  • 问题内容: 我有两列,将集存储在数据框中。 我想使用快速向量化操作在两列上执行集合并集 但是错误使我无法这样做,因为我在两列中都输入了内容。 有解决这个问题的好方法吗? 问题答案: 对于这些操作,纯Python可能更有效。 如果我们可以使用,则可能会花费一半的时间(继承可能不值得): 时序的DataFrame: