当前位置：首页 > 面试题库 >

熊猫：数事

郤令

2023-03-14

问题内容：

在下面，male_trips是一个大熊猫数据帧，station是一个小熊猫数据帧。对于每个车站ID，我想知道有多少次男性旅行。以下工作可以完成，但是需要很长时间：

mc = [ sum( male_trips['start_station_id'] == id ) for id in stations['id'] ]

我应该怎么做呢？

更新！因此，有两种主要方法：groupby()其次是size()和更简单的方法.value_counts()。我很快完成了timeit，这种groupby方法大获全胜！这是代码：

from timeit import Timer
setup = "import pandas; male_trips=pandas.load('maletrips')"
a  = "male_trips.start_station_id.value_counts()"
b = "male_trips.groupby('start_station_id').size()"
Timer(a,setup).timeit(100)
Timer(b,setup).timeit(100)

结果如下：

In [4]: Timer(a,setup).timeit(100) # <- this is value_counts
Out[4]: 9.709594964981079

In [5]: Timer(b,setup).timeit(100) # <- this is groupby / size
Out[5]: 1.5574288368225098

请注意，以这种速度，用于探索数据键入 value_counts的速度稍微快一些，而且记不起来了！

问题答案：

我会喜欢Vishal，但不要使用size（）来使用sum（）来获取分配给每组“ start_station_id”的行数。所以：

df = male_trips.groupby('start_station_id').size()

类似资料：

熊猫：重塑数据

问题内容：我有一个熊猫系列，目前看起来像这样：我想从根本上将其重塑成一个看起来像这样的数据框… 即。逻辑构造，指出每个观察（行）属于哪个类别。我能够编写基于循环的代码来解决该问题，但是鉴于我需要处理的行数众多，这将非常缓慢。有谁知道针对这种问题的矢量化解决方案？我将不胜感激。编辑：有509个类别，我确实有一个清单。问题答案：
Groupby和熊猫计数

我必须根据以下col1、col2和loc的数据进行分组，并计算col3中的项数。此外，还应考虑开始和结束日期，即日期应在2021 1月1日至2021 1月31日之间。最终结果应显示在col4中。数据预期输出
熊猫SettingWithCopyWarning

问题内容： Python 3.4和Pandas 0.15.0 df是一个数据框，而col1是一列。使用下面的代码，我正在检查是否存在值10，并将此类值替换为1000。这是另一个例子。这次，我将基于索引更改col2中的值。这两种都会产生以下警告：最后，这会产生类似的警告，并带有以下建议：我不确定我是否理解警告中指出的讨论。编写这三行代码的更好方法是什么？请注意，该操作有效。问题答案：
熊猫：SettingWithCopyWarning

问题内容：我想将大于任意数（在这种情况下为100）的值替换为（因为如此大的值表示实验失败）。以前，我使用它来替换不需要的值：但是，出现以下错误：从这个StackExchange问题来看，有时似乎可以忽略此警告，但是我不能很好地跟踪讨论，无法确定这是否适用于我的情况。警告基本上是让我知道我将覆盖我的某些值吗？编辑：据我所知，一切都按其应有的方式进行。作为后续措施，我的替换值方法是否非标
大熊猫

我有一个数据帧，如：所以我想通过两个“for循环”添加一些列，如：新的类似数据帧的图片：我的代码不起作用：如何编写代码来获得像第二张图片这样的数据帧？
熊猫最大值指数

问题内容：我有一个包含屏幕名称，tweet，收藏夹等的Pandas DataFrame。我想找到“ favcount”（我已经做过）的最大值，并返回该“ tweet”的屏幕名称我似乎找不到任何东西，任何人都可以帮助我朝正确的方向发展吗？问题答案：使用来获取最大价值的指标。那你可以用编辑：现已弃用，切换为

相关阅读

熊猫groupby与bin计数熊猫总计数不同熊猫逆json_normalize 带有参数的熊猫read_sql 堆叠数据框列（熊猫）

相关文章

猫眼 24届秋招数仓一面凉经猫眼java开发小熊电器—Hr面猫眼前端一面猫眼前端二面

相关问答

熊猫：设置最大行数熊猫：重塑数据框架获取“熊猫”列的总数如何将熊猫数据帧的第n行提取为熊猫数据帧？熊猫的聚集

相关工具

熊猫Flash播放器猫国建设者红猫软路由 TOM猫学说话demo 仿天猫App可打开列表

相关文档

变现猫接入文档 v1.4 数据科学鲜活的数据数据可视化指南 Java 函数速查 Python 数据结构