问题内容: 我有一个从CSV导入的像这样的数据框。 我想添加一个新的MA列,该列计算该列pop的滚动平均值。我尝试了以下 我得到一个错误 所以我想让我尝试一下,如果它不添加任何列就可以工作。我用了 我得到了输出 我似乎无法对栏弹出应用滚动平均。我究竟做错了什么? 问题答案: 要分配列,您可以根据以下内容创建滚动对象: ac2001发布的答案并不是执行此操作最有效的方法。他正在计算数据帧中每一列的滚
问题内容: 新版本的Pandas使用以下界面加载Excel文件: 但是,如果我不知道可用的图纸怎么办? 例如,我正在使用以下工作表的excel文件 数据1,数据2 …,数据N,foo,bar 但我不知道先验。 有什么方法可以从Pandas的Excel文档中获取工作表列表吗? 问题答案: 您仍然可以使用ExcelFile类(和属性): 有关更多选项, 请参阅文档以进行解析…
问题内容: 我想用Pandas的to_sql函数创建一个具有主键的MySQL表(在mysql表中具有主键通常是一种好习惯),如下所示: 但这会创建一个没有任何主键(甚至没有任何索引)的表。 该文档提到了参数“ index_label”,该参数与“ index”参数结合可用于创建索引,但未提及主键的任何选项。 文献资料 问题答案: 免责声明:这个答案是实验性的,而不是实用的,但也许值得一提。 我发现
问题内容: 我需要过滤pandas数据帧中的行,以便特定的字符串列包含提供的子字符串列表中的至少一个。子字符串可能具有不寻常的/正则表达式字符。比较不应该涉及正则表达式,并且不区分大小写。 例如: 我目前使用这样的面具: 我的数据框很大(〜1mio行),lst长度为100。是否有更有效的方法?例如,如果找到其中的第一项,lst则我们不必测试该行的任何后续字符串。 问题答案: 如果你坚持使用纯熊猫,
问题内容: 我有两个要基于列合并的DataFrame。但是,由于其他拼写方式,空格数量不同,不存在变音符,只要它们彼此相似,我希望能够合并。 任何相似性算法都可以使用(soundex,Levenshtein,difflib)。 假设一个DataFrame具有以下数据: 然后我想得到结果DataFrame 问题答案: 类似建议,你可以申请的到df2的指标,然后应用: 如果这些是列,则可以按照相同的方
问题内容: 和pandas和之间的区别是什么? 大小是否仅排除nil? 问题答案: 含值,:
问题内容: 选择/过滤索引为MultiIndex的数据框的行的最常见的熊猫方法是什么? 根据单个值/标签切片 根据一个或多个级别的多个标签进行切片 根据布尔条件和表达式进行过滤 哪种方法在什么情况下适用 为简单起见假设: 输入数据框没有重复的索引键 下面的输入数据框只有两个级别。(此处显示的大多数解决方案一般都适用于N级) 输入示例: 问题1:选择单个项目 如何选择级别为“一个”的行为”a”的行?
问题内容: 我有这个DataFrame,只想要EPS列不是的记录NaN: …例如df.drop(....)要得到这个结果的数据框: 我怎么做? 问题答案: 不要。就拿行,其中是有限的:
问题内容: 我有一个在轴1(列)中具有层次结构索引的数据框(来自操作): 我想将其展平,使其看起来像这样(名称不是关键的,我可以重命名): 我该怎么做呢?(我已经尝试了很多,无济于事。) 根据建议,这是字典形式的头 问题答案: 我认为最简单的方法是将列设置为顶级: 注意:如果to级别具有名称,你也可以通过此名称访问它,而不是0。 如果要将 组合成一个索引(假设你的列中仅包含字符串条目),则可以:
问题内容: 我有一个带有数值的数据框列: 我想查看该列作为箱数: 我如何将结果作为垃圾箱value counts? 问题答案: 你可以使用: 或numpy.searchsorted: …然后value_countsor groupby和合计size: 默认cut返回。 像这样的方法使用所有类别,即使数据中不存在某些类别,也可以使用操作。
问题内容: 假设我有一个数据列,其中包含,和,我想按升序按列对数据帧进行排序,然后按降序按列对数据帧进行排序,我该怎么做? 问题答案: 从0.17.0版开始,不推荐使用该方法,而推荐使用。 sort在0.20.0版本中被完全删除。参数(和结果)保持不变: 你可以使用的升序参数sort: 例如: 如@renadeen所评论 默认情况下,排序不正确!因此,你应该将方法的结果分配给变量,或者将添加到方法
问题内容: 有没有一种首选的方法来将numpy数组的数据类型固定为int(int64或其他),同时仍将元素内部列出为? 特别是,我正在将内部数据结构转换为。在我们的结构中,我们有仍具有NaN的整数类型的列(但该列的dtype为int)。如果将其设为,似乎将所有内容重铸为float,但我们真的很想成为int。 有什么想法吗? 尝试过的事情: 我尝试在下使用该功能,但这并没有帮助。我还尝试使用带有Na
问题内容: 我有这样的词典列表: 我想把它变成这样的大熊猫: 注意:列的顺序无关紧要。 如何将字典列表转换为如上所述的? 问题答案: 假设d你的字典列表很简单:
问题内容: 我有一个数据框如下 当我尝试将一个函数应用于“金额”列时,出现以下错误。 我已经尝试过使用数学模块中的来应用函数。我已经尝试过属性。我已经尝试过的属性。我还尝试过在函数中使用语句。我还看了这篇文章如何在R数据帧中用零替换NA值?同时查看其他文章。我尝试过的所有方法均无效或无法识别NaN。任何提示或解决方案将不胜感激。 问题答案: 我相信DataFrame.fillna()会为你做到这一
问题内容: 我将数据保存在postgreSQL数据库中。我正在使用Python2.7查询此数据并将其转换为Pandas DataFrame。但是,此数据框的最后一列中包含值的字典(或列表?)。DataFrame看起来像这样: 我需要将此列拆分为单独的列,以便DataFrame如下所示: 我遇到的主要问题是列表的长度不同。但是所有列表最多只能包含相同的3个值:a,b和c。而且它们始终以相同的顺序出现