当前位置: 首页 > 面试题库 >

Python-pandas的大小和数量有什么区别?

韦欣德
2023-03-14
问题内容

groupby("x").countgroupby("x").sizepandas和之间的区别是什么?

大小是否仅排除nil?


问题答案:

size包NaN值,count

In [46]:
df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})
df

Out[46]:
   a   b         c
0  0   1  1.067627
1  0   2  0.554691
2  1   3  0.458084
3  2   4  0.426635
4  2 NaN -2.238091
5  2   4  1.256943

In [48]:
print(df.groupby(['a'])['b'].count())
print(df.groupby(['a'])['b'].size())

a
0    2
1    1
2    2
Name: b, dtype: int64

a
0    2
1    1
2    3
dtype: int64 


 类似资料:
  • 问题内容: 他们似乎都 非常 相似,我很好奇哪个软件包对财务数据分析更有利。 问题答案: 熊猫提供了基于NumPy构建的高级数据处理工具。NumPy本身是一个相当底层的工具,类似于MATLAB。另一方面,pandas提供了丰富的时间序列功能,数据对齐,对NA友好的统计信息,groupby,合并和联接方法以及许多其他便利。近年来,它在金融应用中变得非常流行。我的下一本书将专门讨论使用熊猫进行财务数据

  • 问题内容: 我不知道熊猫和功能之间的区别。 以以下示例为例:我加载数据集,执行,定义一个简单函数,然后输入user或。 如您所见,在使用和之后,函数中的print语句得到相同的输出。另一方面,结果是不同的。这是为什么? 使用: 使用 问题答案: 将功能应用于每个组(您的)。您的函数返回1,因此对于3个组,您最终都将获得1值。 汇总 每个 组的 每个列(功能) ,因此最终每个组的每个列都有一个值。

  • 问题内容: 我正在使用读取csv文件的两列,然后将值分配给字典。这些列包含数字和字母字符串。有时在某些情况下单元格为空。在我看来,应读取但应分配该字典条目的值。当然,由于它具有空值,因此更能描述一个空单元格,而nan只是说读取的值不是数字。 我的理解正确吗,和之间有什么区别?为什么分配而不是? 另外,我的字典检查是否有任何空单元格一直在使用: 但这给了我一个错误,说我不能使用此检查v。我猜这是因为

  • 问题内容: 和之间有适用的区别吗? 从Python文档中: :返回字典的(键,值)对列表的副本。 :在字典的(键,值)对上返回迭代器。 如果我运行下面的代码,每个似乎都返回对同一对象的引用。我缺少任何细微的差异吗? 输出: 问题答案: 这是演变的一部分。 最初,构建了一个真正的元组列表,并将其返回。这可能会占用大量额外的内存。 然后,一般将生成器引入该语言,然后将该方法重新实现为名为的迭代器-生成

  • 问题内容: 我知道是软件包的软件包管理器。但是,我看到网站上的安装用于安装IPython。 我可以用来安装吗?我已经拥有了为什么还要用作另一个python软件包管理器pip? 和之间有什么区别? 问题答案: 引用来自Conda博客: 参与python世界已经很长时间了,我们都知道,,但是这些工具不能满足我们所有的特定要求。主要问题是它们专注于Python,而忽略了非Python库依赖项,例如HDF

  • 问题内容: search()和Python 模块中的match()函数和有什么区别?re 我已经阅读了文档(当前文档),但是我似乎从未记得它。我一直在查找并重新学习它。我希望有人会用示例清楚地回答它,以便(也许)它会贴在我的头上。或者至少我将有一个更好的地方来回答我的问题,并且重新学习它所花的时间会更少。 问题答案: 锚定在字符串的开头。这与换行无关,因此它与在模式中使用的方式不同。 如重新匹配文