我有例如[100,30]数据帧,我想找到哪些行有超过20列的值?所有行都有30列,但其中一些有NaN值,因此我设置了20列的限制,我想在col.iloc=20之后找到哪些行有列的值
例如,即使在行号05我们有更多的楠值,由于分布,我想找到哪些行有超过3列的X值或楠值(在下表中,我想找到行号1、3、4和7的索引。
我的预期结果:
我发现行的 ID:1,3,4,7 是行在列中有值
但在大型数据帧中 这并不容易
尝试
out = df[df.iloc[:, 4:].isna().all(axis=1)]
print(out)
# Output
ID Col.01 Col.02 Col.03 Col.04 Col.05
1 02 X X X NaN NaN
4 05 X NaN NaN NaN NaN
5 06 X X X NaN NaN
如果列有名称,可以使用<code>df。loc[:,'Col.04':]而不是df。iloc[:,4:]
。
您可以使用
df.column.isna().sum()
以查找列中 NaN 值的数量。请参考此答案。
本文向大家介绍如何基于R中的某些列查找唯一行?,包括了如何基于R中的某些列查找唯一行?的使用技巧和注意事项,需要的朋友参考一下 特别是当实验条件相同时,我们希望某些列的某些行值相同,这在设计实验以检查变量的固定效果时也有意做到。如果要确定唯一行,则可以通过使用R中的唯一函数来完成。 示例 请看以下数据帧- 让我们看另一个例子-
给定一个包含可能分散在各处的NaN值的pandas数据frame: 问题:如何确定哪些列包含NaN值?特别是,我可以获得包含NANS的列名列表吗?
问题内容: 给定一个熊猫数据框,其中包含可能在此处和附近散布的NaN值: 问题: 如何确定哪些列包含NaN值?特别是,我可以获取包含NaN的列名称的列表吗? 问题答案: 更新: 使用熊猫0.22.0 较新的Pandas版本具有新的方法‘DataFrame.isna()’和‘DataFrame.notna()’ 作为列列表: 选择这些列(至少包含一个值): 旧答案: 尝试使用isnull(): 或作
问题内容: 我在pyspark中使用sqlContext.sql函数读取了一个数据框。它包含4个数字列,每个客户都有信息(这是键ID)。我需要计算每个客户端的最大值并将此值加入数据框: 在这种情况下,客户端“ six”的最大值为23,而客户端“ ten”的最大值为30。“ null”在新列中自然为null。 请帮助我显示如何执行此操作。 问题答案: 我认为将值组合到列表中而不是找到最大值将是最简单
假设我有下面的。我想组合价格列和值列,以便所有价格都在一列中,所有卷都在另一列中。我还想要标识价格级别的第三列。例如,、和。 这就是最终的df应该是什么样子: 我尝试使用,我认为几乎有正确的答案。 这就是熔融时部分df的样子: 上面的问题是,数量和价格在同一列中,但我希望它们在两个单独的列中。 我使用了正确的函数吗?
问题内容: 有人知道通过十六进制值或CHAR()值搜索MySQL表列的语法吗?我必须使用LIKE还是IN()? 就像是: 或者 谢谢! 问题答案: 第二个接近。 试试这个: