当前位置：首页 > 面试题库 >

在熊猫数据帧上的向量化查找

商绍元

2023-03-14

问题内容：

我有两个DataFrames。。。

df1 是一个表，我需要从使用索引的值中提取值，这些索引是从df2中的多个列检索到的。

我看到有一个函数get_value可以在给定索引和列值的情况下完美运行，但是当尝试向量化此函数以创建新列时，我失败了…

df1 = pd.DataFrame(np.arange(20).reshape((4, 5)))

df1.columns = list('abcde')

df1.index = ['cat', 'dog', 'fish', 'bird']

        a   b   c   d   e
cat     0   1   2   3   4
dog     5   6   7   8   9
fish    10  11  12  13  14
bird    15  16  17  18  19

df1.get_value('bird, 'c')

17

现在，我需要做的是在df2-上建立一个新的新列-当df1基于索引建立索引时，有效地向量化上述函数中指定的animal，来自的列对。letter``df2``pd.get_value

df2 = pd.DataFrame(np.arange(20).reshape((4, 5)))

df2['animal'] = ['cat', 'dog', 'fish', 'bird']

df2['letter'] = list('abcd')

    0   1   2   3   4   animal  letter
0   0   1   2   3   4   cat     a
1   5   6   7   8   9   dog     b
2   10  11  12  13  14  fish    c
3   15  16  17  18  19  bird    d

导致。。。

    0   1   2   3   4   animal  letter   looked_up
0   0   1   2   3   4   cat     a        0
1   5   6   7   8   9   dog     b        6
2   10  11  12  13  14  fish    c        12
3   15  16  17  18  19  bird    d        18

问题答案：

有一个恰当地命名的函数lookup可以做到这一点。

df2['looked_up'] = df1.lookup(df2.animal, df2.letter)

df2

    0   1   2   3   4 animal letter  looked_up
0   0   1   2   3   4    cat      a          0
1   5   6   7   8   9    dog      b          6
2  10  11  12  13  14   fish      c         12
3  15  16  17  18  19   bird      d         18

类似资料：

熊猫数据帧绘图

我有这个熊猫数据框这就给了我：我该怎么办做一个新的人物，将标题添加到图"标题这里" 以某种方式创建一个映射，这样标签不是29,30等，而是“29周”，“30周”等。将图表的较大版本保存到我的计算机（例如10 x 10英寸）这件事我已经琢磨了一个小时了！
熊猫：查找不在另一个数据帧中的数据帧行[重复]

我有两个Pandas Dataframe和，其中是的一部分，我想创建一个Dataframe，其中包含中的code>。以下是一个例子：注：我的DataFrame可能有多个列，但是必须仅在列上进行匹配。
如何将熊猫数据帧的第n行提取为熊猫数据帧？

假设熊猫数据帧如下所示：如何将第三行（如row3）提取为pd数据帧？换句话说，row3.shape应该是（1,5），row3.head（）应该是：
Python熊猫重塑数据帧

这似乎是非常基本的知识，但我还是卡住了，尽管我有一些数据处理的理论背景（通过其他软件）。值得一提的是，我是蟒蛇和熊猫图书馆的新手。我的任务是将系列名称列的值作为单独的列（从长到宽转换）。我花了很长时间尝试不同的方法，但只有错误。例如：我犯了一个错误： ...很多短信...通过值的长度是2487175，索引暗示2 有谁能指导我完成这个过程吗？谢谢它用于代码“mydata=mydata”。pi
熊猫-如何随机化数据帧的行[重复]

我试图通过保持行之间的一致性来随机化我的行，但会混淆行的顺序，从而随机化从属变量。我有以下数据帧：并将行随机化：然后执行重置索引，如期望输出：
按行切片熊猫数据帧

我正在使用从h5文件加载的调查数据作为通过熊猫包。在此中，所有行都是单个调查的结果，而列是单个调查中所有问题的答案。我的目标是将此数据集缩减为更小的，仅包括在某个问题上具有某个描述答案的行，即在本列中具有相同的值。我能够确定具有此条件的所有行的索引值，但我找不到如何删除这些行或仅使用这些行创建新的df。

相关阅读

在pandas数据帧中向量化条件分配如何在熊猫中合并“（df1＆not df2）”数据帧？在熊猫数据框中查找连续的片段高效扁平化熊猫数据框 Pandas数据框中的值的向量化查找

相关文章

SQL优化实战：如何通过读写分离对千万级数据量查询进行优化？猫眼娱乐数据开发面经 10.12-猫眼-大数据-一面+二面 Matlab向量 MariaDB查询数据

相关问答

按行切片熊猫数据帧将标量转换为熊猫数据帧[重复]寻找查找代码添加列到熊猫数据帧从相同的数据帧查询在熊猫中连接两个数据帧的行 Python熊猫数据帧加入两个数据帧[复制]

相关工具

熊猫Flash播放器 Redis数据查看工具 SQL Server 数据库发布向导丁丁主数据查重工具 photo批量上传ftp

相关文档

鲜活的数据数据可视化指南面向程序员的数据挖掘指南 Python 量化交易教程纸上谈兵：算法与数据结构小米结构化数据存储服务 SDS 开发指南