问题内容: 我想在excel电子表格中阅读python / pandas,但使用公式而不是单元格结果。 例如,如果单元格A1为25,单元格B1 == A1,我希望数据框显示: 现在它显示: 我该怎么办? 问题答案: 开箱即用提供此功能。看到这里和这里。一个例子:
问题内容: 我正在将csv文件读入。该csv文件由四列和一些行组成,但没有要添加的标题行。我一直在尝试以下方法: 但是,当我应用代码时,出现以下错误: 错误的确切含义是什么?在python中将标题行添加到csv文件/ pandas df的干净方法是什么? 问题答案: 您可以直接在 names:类似数组,默认为None要使用的列名列表。如果文件不包含标题行,则应显式传递header = None
问题内容: 熊猫包含名为的列,其中包含非唯一值。我可以使用以下方法将该行中的行分组: 但是,这会将数据按值分割。我想按“日期”列中存储的年份对这些数据进行分组。此页面显示了在使用时间戳作为索引的情况下如何按年份分组,在我的情况下情况并非如此。 如何实现此分组? 问题答案: 我正在使用熊猫0.16.2。这对我的大型数据集具有更好的性能: 使用选项和玩弄,等变得更加容易。
问题内容: 我有一些层次结构数据,这些数据触底到达时间序列数据,看起来像这样: 我想对每个城市进行时间重采样,所以类似 将输出 就这样,让我 足够公平,但是我有点希望这能起作用: 在这一点上,我真的没什么主意了……是否有某种方法可以帮助我解决问题? 问题答案: 允许您指定“目标对象的groupby指令”。特别是,即使不是,您也可以使用它按日期分组: 在讲述寻找在多指标的最后一个级别的日期。此外,您
问题内容: 如何将字符串的熊猫索引转换为日期时间格式 我的数据框“ df”是这样的 但是索引的类型是字符串,但是我需要一个日期时间格式,因为我得到了错误 使用时 问题答案: 它应该按预期工作。尝试运行以下示例。
问题内容: 我是Python和Pandas的新手,所以可能有一个我看不到的简单解决方案。 我有一些看起来像这样的不连续数据集: 我现在正在寻找一种解决方案,以实现以下目标: 问题是,A中的间隙因数据集的位置和长度而异… 问题答案: 和是你的朋友。 首先将A列移至索引: 然后使用新索引重新索引,此处使用nans填充缺少的数据。我们使用对象是因为我们可以命名它。这将在下一步中使用。 最后使用将索引移回
问题内容: 我不知道熊猫和功能之间的区别。 以以下示例为例:我加载数据集,执行,定义一个简单函数,然后输入user或。 如您所见,在使用和之后,函数中的print语句得到相同的输出。另一方面,结果是不同的。这是为什么? 使用: 使用 问题答案: 将功能应用于每个组(您的)。您的函数返回1,因此对于3个组,您最终都将获得1值。 汇总 每个 组的 每个列(功能) ,因此最终每个组的每个列都有一个值。
问题内容: 我想计算每个值出现在数据框中的次数。 这是我的数据框- : 我想对字典进行计数: 例如 我试过了,但它给了而且也没有用。 问题答案: 您可以使用和:
问题内容: 如何添加值的标签以显示在条形图中的条形上方: 问题答案: 捕获绘图所在的轴,然后将其作为普通对象进行操作。将值放在条形上方将是这样的:
问题内容: 我有以下Python pandas数据框: 我想要: 我看过pivot(),pivot_table(),Transpose和unstack(),它们似乎都没有给我。熊猫新手,所以所有帮助表示赞赏。 问题答案: 您需要通过转置: 如果需要重命名列,则有点复杂: 另一个更快的解决方案是使用: 时间 :
问题内容: 在对某些功能进行单元测试的上下文中,我试图使用python pandas建立2个DataFrames的相等性: 鉴于我正在尝试针对的完整测试(包括职位),我在做什么错? 比较包含s的Series / DataFrames相等性的最简单方法是什么? 问题答案: 您可以将assert_frame_equals与check_names = False一起使用(以免检查索引/列名称),如果它们
问题内容: 我有一个Python3.x pandas DataFrame,其中某些列是用字节表示的字符串(例如在Python2.x中) 当我按列访问时,我看到 但是,如果按元素访问,则它是一个“字节”对象 如何将它们转换为“常规”字符串?也就是说,如何摆脱这个前缀? 问题答案: 您可以使用向量化将字节字符串解码为普通字符串: 为此,您可以仅选择str列: 转换所有的: 然后,您可以将转换后的col
问题内容: 我正在尝试创建一个列(“ consec”),该列将连续计数另一个(“二进制”)中的连续值,而不使用循环。这是预期的结果: 但是这个 导致… 我看到了其他使用分组或排序的帖子,但不幸的是,我看不到如何对我有用。在此先感谢您的帮助。 问题答案: 您可以使用compare-cumsum-groupby模式(我 确实 需要解决这个问题才能编写文档),最后是: 之所以有效,是因为首先我们得到了要
问题内容: 我有一个包含面板数据的数据框,比方说这是100个不同对象的时间序列: 我想添加一个新列,该列将为每个对象存储先前的列: 我可以通过某种方式使用.shift()和.groupby()吗? 问题答案: 是的,只需执行以下操作: 对于此示例数据框: 结果将是:
问题内容: 这是一个与该问题 “在pandas DataFrame中为特定单元格设置值”)非常相似的问题,但有一个主要区别:我选择的数据不是按其索引而是按某些条件进行更改。 如果我应用的条件返回一行,我希望能够以一种简单的方式设置该行中某个列的值,但是我的第一次尝试不起作用: 因此,与其将2009年周日的香蕉销量设置为100,没有任何反应!最好的方法是什么?理想情况下,解决方案应使用行号,因为您通