当前位置：首页 > 面试题库 >

在熊猫的DataFrame上插值

周越泽

2023-03-14

问题内容：

我有一个DataFrame，说一个波动率表面，索引为时间，列为行权。如何进行二维插值？我可以，reindex但是我该如何处理NaN？我知道我们可以，fillna(method='pad')但是甚至不是线性插值。有没有办法插入我们自己的方法进行插值？

问题答案：

您可以DataFrame.interpolate用来获取线性插值。

In : df = pandas.DataFrame(numpy.random.randn(5,3), index=['a','c','d','e','g'])

In : df
Out:
          0         1         2
a -1.987879 -2.028572  0.024493
c  2.092605 -1.429537  0.204811
d  0.767215  1.077814  0.565666
e -1.027733  1.330702 -0.490780
g -1.632493  0.938456  0.492695

In : df2 = df.reindex(['a','b','c','d','e','f','g'])

In : df2
Out:
          0         1         2
a -1.987879 -2.028572  0.024493
b       NaN       NaN       NaN
c  2.092605 -1.429537  0.204811
d  0.767215  1.077814  0.565666
e -1.027733  1.330702 -0.490780
f       NaN       NaN       NaN
g -1.632493  0.938456  0.492695

In : df2.interpolate()
Out:
          0         1         2
a -1.987879 -2.028572  0.024493
b  0.052363 -1.729055  0.114652
c  2.092605 -1.429537  0.204811
d  0.767215  1.077814  0.565666
e -1.027733  1.330702 -0.490780
f -1.330113  1.134579  0.000958
g -1.632493  0.938456  0.492695

对于更复杂的事情，您需要推出自己的函数来处理一个Series对象并根据需要填充NaN值并返回另一个Series对象。

类似资料：

熊猫DataFrame性能

问题内容： Pandas确实很棒，但令我惊讶的是，从Pandas.DataFrame检索值的效率低下。在下面的玩具示例中，即使DataFrame.iloc方法也比字典慢100倍以上。问题：这里的教训仅仅是字典是查找价值的更好方法吗？是的，我知道那正是他们的目的。但是我只是想知道是否缺少有关DataFrame查找性能的信息。我意识到这个问题比“提问”更“有趣”，但是我会接受一个提供洞察力或观点的
熊猫在groupby内插

问题内容：我有一个包含以下信息的数据框：我想根据索引插入数据帧中的值，但仅在每个文件组中。插值，我通常会做和我一起做我希望插入的数据帧看起来像这样： NaN仍然存在于t = 6的位置，因为它们是file2组中的第一项。我怀疑我需要使用“应用”，但是还无法确切地知道如何… 任何帮助，将不胜感激。问题答案：
熊猫DataFrame的条件逻辑

问题内容：如何将条件逻辑应用于Pandas DataFrame。请参见下面显示的DataFrame，我的原始数据显示在“数据”列中，并且期望的输出显示在其旁边。如果“数据”中的数字小于2.5，则所需的输出为False。我可以应用循环并重新构建DataFrame …但是那是“非Python的” 问题答案：只需将列与该值进行比较：
大熊猫：DataFrame行上的复杂过滤器

问题内容：我想通过每行的功能来过滤行，例如或者再举一个更复杂，人为的例子，我该怎么办？问题答案：您可以使用来执行此操作，该功能会沿给定轴应用功能，
熊猫DataFrame concat与追加

问题内容：我有一个4个熊猫数据框的列表，其中包含我想合并为一个数据框的一天的报价数据。我无法理解concat在时间戳上的行为。请参阅以下详细信息：使用我得到：使用我得到：注意使用时索引如何变化。为什么会发生这种情况，我将如何使用该方法来重现使用所获得的结果？（因为看上去快得多；每个循环24.6 ms，而每个循环3.02 s）问题答案：因此，您正在执行的操作是append和concat
大熊猫：在DataFrame中合并两列

问题内容：我有一个熊猫，其中有多个列：其中和是包含相同数据但名称不同的列。有没有一种方法可以将组成行的行移动到理想状态，同时保持名称？最后，DataFrame应该显示为：那就是构成bar的NaN值被替换为的值。问题答案：尝试这个：如果您希望该数据成为新列，只需将结果分配给即可。

相关阅读

熊猫DataFrame concat与追加大熊猫：在DataFrame中合并两列熊猫：在DataFrame中创建汇总列熊猫：求和给定列的DataFrame行 OpenShift v3上的熊猫

相关文章

小熊电器—Hr面猫眼前端一面猫眼前端二面天猫一面凉经七猫运营笔试

相关问答

在熊猫中引用熊猫的聚集删除熊猫DataFrame列中字符串条目的末尾插入一行到熊猫数据框引用str的；熊猫身上的浮子

相关工具

熊猫Flash播放器 dataframe-js Stream 上传插件 jQuery异步上传插件猫国建设者

相关文档

变现猫接入文档 v1.4 WordPress 插件开发 Babel 插件手册 TweenMax 插件帮助文档 Kibana 插件开发教程