有没有一种方法可以从Pandas的DataFrame中选择随机行。
在R中,使用汽车包装,有一个有用的功能some(x, n)
,它类似于head,但在此示例中,从x中随机选择10行。
我也看过切片文档,似乎没有什么等效的。
现在使用版本20。有一个示例方法。
df.sample(n)
像这样吗
import random
def some(x, n):
return x.ix[random.sample(x.index, n)]
注: 由于熊猫v0.20.0的,ix
已被弃用,赞成loc
基于标签索引。
我想使用两列作为行ID,同时计算基于时间的分组。请看下图: 转化成这样: 正在发生的是,X在时间10发生了0次,但在15和23发生了1次。 Y在10点钟发生了3次,但在15和23没有。等等。
我试图通过保持行之间的一致性来随机化我的行,但会混淆行的顺序,从而随机化从属变量。我有以下数据帧: 并将行随机化: 然后执行重置索引,如 期望输出:
我有一个数据帧: 我需要添加第一行[2,3,4]来获得: 我尝试了和函数,但找不到正确的方法。 如何添加/插入系列到数据框?
问题内容: 我可以使用 功能来删除将部分或全部列设置为的行。是否存在用于删除所有列的值为0的行的等效函数? 在此示例中,我们要删除数据帧的前4行。 谢谢! 问题答案: 事实证明,这可以向量化的方式很好地表达:
问题内容: 开发可修剪前导和尾随空白的功能。 这是一个简单的示例,但是实际文件包含的行和列要复杂得多。 结果应消除所有前导和尾随空格,但保留文本之间的空格。 请注意,该功能需要涵盖所有可能的情况。谢谢 问题答案: 我认为需要检查值是否为字符串,因为列中的混合值-带字符串的数字和每个字符串调用: 如果列具有相同的dtype,则对于列中的数值,您的示例中不会得到:
问题内容: 我很好奇,为什么不支持,而与这两个工作。 我希望以与Python索引约定一致的方式进行工作。有设计上的原因不支持按单个整数索引行吗? 问题答案: 回显@HYRY,请参阅0.11中的新文档 http://pandas.pydata.org/pandas- docs/stable/indexing.html 在这里,我们有了新的运算符,以显式支持仅整数索引,并且显式仅支持标签索引 例如,想