当前位置: 首页 > 面试题库 >

熊猫数据框中的随机行选择

仲璞瑜
2023-03-14
问题内容

有没有一种方法可以从Pandas的DataFrame中选择随机行。

在R中,使用汽车包装,有一个有用的功能some(x, n),它类似于head,但在此示例中,从x中随机选择10行。

我也看过切片文档,似乎没有什么等效的。

现在使用版本20。有一个示例方法。

df.sample(n)


问题答案:

像这样吗

import random

def some(x, n):
    return x.ix[random.sample(x.index, n)]

注: 由于熊猫v0.20.0的,ix 已被弃用,赞成loc基于标签索引。



 类似资料:
  • 我想使用两列作为行ID,同时计算基于时间的分组。请看下图: 转化成这样: 正在发生的是,X在时间10发生了0次,但在15和23发生了1次。 Y在10点钟发生了3次,但在15和23没有。等等。

  • 我试图通过保持行之间的一致性来随机化我的行,但会混淆行的顺序,从而随机化从属变量。我有以下数据帧: 并将行随机化: 然后执行重置索引,如 期望输出:

  • 我有一个数据帧: 我需要添加第一行[2,3,4]来获得: 我尝试了和函数,但找不到正确的方法。 如何添加/插入系列到数据框?

  • 问题内容: 我可以使用 功能来删除将部分或全部列设置为的行。是否存在用于删除所有列的值为0的行的等效函数? 在此示例中,我们要删除数据帧的前4行。 谢谢! 问题答案: 事实证明,这可以向量化的方式很好地表达:

  • 问题内容: 开发可修剪前导和尾随空白的功能。 这是一个简单的示例,但是实际文件包含的行和列要复杂得多。 结果应消除所有前导和尾随空格,但保留文本之间的空格。 请注意,该功能需要涵盖所有可能的情况。谢谢 问题答案: 我认为需要检查值是否为字符串,因为列中的混合值-带字符串的数字和每个字符串调用: 如果列具有相同的dtype,则对于列中的数值,您的示例中不会得到:

  • 问题内容: 我很好奇,为什么不支持,而与这两个工作。 我希望以与Python索引约定一致的方式进行工作。有设计上的原因不支持按单个整数索引行吗? 问题答案: 回显@HYRY,请参阅0.11中的新文档 http://pandas.pydata.org/pandas- docs/stable/indexing.html 在这里,我们有了新的运算符,以显式支持仅整数索引,并且显式仅支持标签索引 例如,想