当前位置：首页 > 面试题库 >

以向量化方式计算大pandas中特定连续相等值的数量

西门凯康

2023-03-14

问题内容：

假设我们有以下pandas DataFrame：

In [1]:
import pandas as pd
import numpy as np

df = pd.DataFrame([0, 1, 0, 0, 1, 1, 0, 1, 1, 1], columns=['in'])
df
Out[1]: 
   in
0   0
1   1
2   0
3   0
4   1
5   1
6   0
7   1
8   1
9   1

如何以 向量化的方式计算 大熊猫的连续数量？我想要这样的结果：

类似于矢量化求和运算的操作，它会在特定条件下重置。

问题答案：

您可以执行以下操作（贷方：如何使用系列/数据框模拟itertools.groupby）：

>>> df['in'].groupby((df['in'] != df['in'].shift()).cumsum()).cumsum()
0    0
1    1
2    0
3    0
4    1
5    2
6    0
7    1
8    2
9    3
dtype: int64

类似资料：

numpy.linalg.eig() 计算矩阵特征向量方式

本文向大家介绍numpy.linalg.eig() 计算矩阵特征向量方式，包括了numpy.linalg.eig() 计算矩阵特征向量方式的使用技巧和注意事项，需要的朋友参考一下在PCA中有遇到，在这里记录一下计算矩阵的特征值个特征向量，下面给出几个示例代码：在使用前需要单独import一下官方文档链接：http://docs.scipy.org/doc/numpy/reference/g
计算numpy数组中长度连续变化的值的连续出现

问题内容：假设我在numpy数组中有一堆数字，并且根据返回布尔数组的条件对它们进行了测试：并使用此布尔数组，我想计算True连续出现的所有长度。例如，如果我有，我想回去。我可以使用以下代码来做到这一点：但是是否已经为此或python，numpy，scipy等函数实现了任何功能，该函数计算给定输入在列表或数组中连续出现的长度？问题答案：这是使用的解决方案（可能不是最快的解决方案）：
向量化pandas中的函数

问题内容：我有一个包含经纬度坐标列表的数据框：我的目标是使用Haversine函数找出KM中每个项目之间的距离：我的目标是得到一个看起来像result_df的数据框，其中的值是每个提供程序ID之间的距离：我可以循环执行此操作，但是速度非常慢。我正在寻找一些帮助将其转换为向量化方法：问题答案：为了矢量化此代码，您将需要对完整的数据框进行操作，而不要对单个经纬度进行操作。我对此做了尝试。我
计算Python数组中的连续正值

问题内容：我正在尝试计算股票收益数据中连续上升的天数- 因此，如果正数日为1，负数为0，则应该返回一个列表。我来到了一个解决方案，它在代码行数方面很整洁，但是非常慢：我猜想我遍历整个列表太多次了。是否有一种很好的Pythonic方式可以实现我想要的，而只需要遍历一次数据？我可以自己编写一个循环，但想知道是否有更好的方法。谢谢！问题答案：为什么痴迷于超pythonic的做事方式？可读
添加变量以计算连续月份

我在Postgres数据库中有一个查询，它结合了客户端订阅。我想添加一个称为“连续月份”的变量，但我不确定在Postgres中如何添加。我的原始桌子是这样的：我希望有一个连续数月的东西，比如：谢谢你在先进的帮助！
Pandas数据框中的值的向量化查找

问题内容：我有两个熊猫数据框，一个叫做“ orders”，另一个叫做“ daily_prices”。daily_prices如下：订单如下：两个数据帧的索引均为datetime.date。通过使用列表解析来遍历所有订单并在“ daily_prices”数据框中查找特定日期的特定报价，然后将该列表作为列添加到“订单”数据框中的“价格”列。 “订单”数据框。我想使用数组操作而不是循环执行此操作。

以向量化方式计算大pandas中特定连续相等值的数量

相关阅读

相关文章

相关问答

相关工具

相关文档