当前位置：首页 > 面试题库 >

Python-pandas的大小和数量有什么区别？

韦欣德

2023-03-14

问题内容：

groupby("x").count和groupby("x").sizepandas和之间的区别是什么？

大小是否仅排除nil？

问题答案：

size包含NaN值，count：

In [46]:
df = pd.DataFrame({'a':[0,0,1,2,2,2], 'b':[1,2,3,4,np.NaN,4], 'c':np.random.randn(6)})
df

Out[46]:
   a   b         c
0  0   1  1.067627
1  0   2  0.554691
2  1   3  0.458084
3  2   4  0.426635
4  2 NaN -2.238091
5  2   4  1.256943

In [48]:
print(df.groupby(['a'])['b'].count())
print(df.groupby(['a'])['b'].size())

a
0    2
1    1
2    2
Name: b, dtype: int64

a
0    2
1    1
2    3
dtype: int64

类似资料：

Python中的Pandas和NumPy + SciPy有什么区别？

问题内容：他们似乎都非常相似，我很好奇哪个软件包对财务数据分析更有利。问题答案：熊猫提供了基于NumPy构建的高级数据处理工具。NumPy本身是一个相当底层的工具，类似于MATLAB。另一方面，pandas提供了丰富的时间序列功能，数据对齐，对NA友好的统计信息，groupby，合并和联接方法以及许多其他便利。近年来，它在金融应用中变得非常流行。我的下一本书将专门讨论使用熊猫进行财务数据
pandas agg和apply function有什么区别？

问题内容：我不知道熊猫和功能之间的区别。以以下示例为例：我加载数据集，执行，定义一个简单函数，然后输入user或。如您所见，在使用和之后，函数中的print语句得到相同的输出。另一方面，结果是不同的。这是为什么？使用：使用问题答案：将功能应用于每个组（您的）。您的函数返回1，因此对于3个组，您最终都将获得1值。汇总每个组的每个列（功能），因此最终每个组的每个列都有一个值。
Python-NaN和None有什么区别？

问题内容：我正在使用读取csv文件的两列，然后将值分配给字典。这些列包含数字和字母字符串。有时在某些情况下单元格为空。在我看来，应读取但应分配该字典条目的值。当然，由于它具有空值，因此更能描述一个空单元格，而nan只是说读取的值不是数字。我的理解正确吗，和之间有什么区别？为什么分配而不是？另外，我的字典检查是否有任何空单元格一直在使用：但这给了我一个错误，说我不能使用此检查v。我猜这是因为
Python-dict.items（）和dict.iteritems（）有什么区别？

问题内容：和之间有适用的区别吗？从Python文档中：：返回字典的（键，值）对列表的副本。：在字典的（键，值）对上返回迭代器。如果我运行下面的代码，每个似乎都返回对同一对象的引用。我缺少任何细微的差异吗？输出：问题答案：这是演变的一部分。最初，构建了一个真正的元组列表，并将其返回。这可能会占用大量额外的内存。然后，一般将生成器引入该语言，然后将该方法重新实现为名为的迭代器-生成
Python-pip和conda有什么区别？

问题内容：我知道是软件包的软件包管理器。但是，我看到网站上的安装用于安装IPython。我可以用来安装吗？我已经拥有了为什么还要用作另一个python软件包管理器pip？和之间有什么区别？问题答案：引用来自Conda博客：参与python世界已经很长时间了，我们都知道，，但是这些工具不能满足我们所有的特定要求。主要问题是它们专注于Python，而忽略了非Python库依赖项，例如HDF
Python-re.search和re.match有什么区别？

问题内容： search()和Python 模块中的match()函数和有什么区别？re 我已经阅读了文档（当前文档），但是我似乎从未记得它。我一直在查找并重新学习它。我希望有人会用示例清楚地回答它，以便（也许）它会贴在我的头上。或者至少我将有一个更好的地方来回答我的问题，并且重新学习它所花的时间会更少。问题答案：锚定在字符串的开头。这与换行无关，因此它与在模式中使用的方式不同。如重新匹配文

Python-pandas的大小和数量有什么区别？

相关阅读

相关文章

相关问答

相关工具

相关文档