问题内容: 我有一个DataFrame,其索引仅为datetime.time,而DataFrame.Index和datetime.time中没有方法来移动时间。datetime.time已替换,但仅适用于系列的单个项目吗? 这是使用的索引的示例: 问题答案: Liam的链接看起来不错,但也可以签出-看起来可以很好地与NumPy和Python的时间增量配合使用。 https://pandas.pyd
问题内容: 我正在尝试将CSV文件读入pandas数据框并选择一列,但始终收到关键错误。 该文件已成功读取,我可以在iPython笔记本中查看数据框,但是当我想选择除第一个列以外的任何列时,它将引发关键错误。 我正在使用此代码: 这是我正在处理的文件:https : //www.dropbox.com/s/81iwm4f2hsohsq3/transactions.csv?dl=0 谢谢! 问题
问题内容: 我可以将StringIO对象传递给pd.to_csv()很好: 但是当使用excel编写器时,我遇到了很多麻烦。 返回一个 我正在尝试创建一个不调用的对象,但是遇到了一些麻烦。到目前为止,这是我尝试过的: 但是现在我得到了 如何将Excel格式的熊猫数据框保存到对象? 问题答案: 尽管每个编写器引擎都支持,但Pandas期望ExcelWriter构造函数的文件名路径。也许应该将其作为熊
问题内容: 我能够使用python datetime对象读取和切片pandas数据帧,但是我被迫仅使用索引中的 现有日期 。例如,这有效: 但是,如果我使用DF中不存在的开始或结束日期,则会收到python KeyError。 我的问题:如何查询数据框对象的日期范围?即使DataFrame中没有开始日期和结束日期。熊猫是否允许基于范围的切片? 我正在使用熊猫0.10.1版 问题答案: 用于先找到最
问题内容: 如果数据如下所示: 我想复制IsHoliday等于TRUE的行,我可以这样做: 但是是否有更好的方法来执行此操作,因为我需要将假日行重复5次,如果使用上述方法,则必须追加5次。 问题答案: 您可以放入列表中,然后执行以下操作:
问题内容: 我有这个网页的csv档案。我想阅读下载文件中的某些列(可以在右上角下载csv版本)。 假设我要2列: 59在标题中是 60在标题中是。 但是,由于某些原因,网页的作者有时决定四处移动列。 最后,我想要这样的东西,请记住,价值可能会丢失。 如果这些列保持正确的名称,这将防止我的程序在将来再次更改列时出错。 到目前为止,我已经尝试过各种使用模块的方法,最近都尝试过使用该模块。两者都没有运气
问题内容: 我正在使用该功能将Excel文件导入到熊猫数据框。 列之一是表的主键:它是所有数字,但是存储为文本(Excel单元格左上角的绿色小三角形确认了这一点)。 但是,当我将文件导入pandas数据框时,该列将以浮点形式导入。这意味着,例如“ 0614”变为614。 导入列时是否可以指定数据类型?我知道在导入CSV文件时这是可能的,但找不到的语法。 我能想到的唯一解决方案是在Excel中的文本
问题内容: 我想知道是否有一个功能可以更改特定的列名称,但无需选择特定的名称或不更改所有的名称。 我有代码: 但是有了它,我必须手动更改每个人的名字。也要改变我所有的人 我想有一个功能来更改第1列和第3列,而不必仅说明其位置而仅写它们的名称。谢谢! 问题答案: 假设您有一个包含新列名的字典以及应替换的列名: 但是,如果您没有索引,而只有索引,则可以执行以下操作:
问题内容: 在python中,如何引用上一行并针对它计算一些内容?具体来说,我有工作在-我有一个数据帧全的股票价格信息,看起来像这样: 这是我创建此数据框的方法: 从第2行开始,或者在这种情况下,我想是250(PS- 是索引吗?),我想为此数据帧中的每个条目计算2011-01-03和2011-01-04之间的差。我相信适当的方法是编写一个函数,该函数采用当前行,然后找出前一行,并计算它们之间的差,
问题内容: 可以说我有一个MultiIndex系列: 我想应用一个使用行索引的函数: 我该怎么做?进行此类操作的推荐方法是什么?我希望获得一个新的Series,并将此函数所产生的值应用于每行并具有相同的MultiIndex。 问题答案: 我认为无法访问该索引;它将每行视为一个numpy对象,而不是一个Series,如您所见: 要解决此限制,请将索引提升为列,应用函数,然后使用原始索引重新创建Ser
问题内容: 我用python 2.7.7安装了Anaconda。 但是,每当我运行“ import pandas”时,都会出现错误: 我尝试运行建议的命令,但它指出 有人遇到过这个问题并找到了解决方案吗? 问题答案: Pandas使用C语言编写了部分代码,以使其运行更快。如果尝试手动安装熊猫,则需要对其进行构建。尝试在此处使用miniconda软件包管理器重新安装它:http ://conda.p
问题内容: 具有向量化if / else的语义(类似于Apache Spark的/ DataFrame方法)。我知道我可以在pandas上使用,但通常会定义自己的API来代替原始函数使用,通常使用/更为方便。 果然,我发现了。但是,乍一看,它具有完全不同的语义。我找不到一种方法来重写使用pandas的最基本的示例: 我是否缺少明显的东西?还是将熊猫命名为一个完全不同的用例,尽管名称与相同? 问题答
问题内容: 我需要分析mongodb中的集合中有大量数据。如何将这些数据导入熊猫? 我是pandas和numpy的新手。 编辑:mongodb集合包含带有日期和时间标记的传感器值。传感器值是float数据类型。 样本数据: 问题答案: 可能会帮助您,以下是我正在使用的一些代码:
问题内容: 我正在使用xlsxwriter将pandas DataFrame保存为_excel。我已经设法格式化了所有数据(设置列宽,字体大小等),除了更改标题的字体外,我找不到解决方法。这是我的示例: 试图为标题设置格式的倒数第二行不执行任何操作。 问题答案: 我认为您需要先重置默认标题样式,然后才能更改它: 全部一起: 在Excel中,单元格格式将覆盖行格式,而列格式将覆盖列格式。将转换为格式
问题内容: 我有一个这样的dataFrame,我想每60分钟进行一次分组,然后从06:30开始分组。 我在用: 我得到这个分组: 但我正在寻找这个结果: 我如何告诉该功能以6小时30分开始以一小时为间隔进行分组? 如果 .groupby(pd.TimeGrouper(freq =‘60Min’)) 无法完成此 操作 ,最好的方法是怎么做? 致敬并非常感谢 问题答案: 使用会同中的参数。 指定将使时