问题内容: 有很多类似的问题,但没有一个专门针对此问题。 我有一个数据帧列表,我需要使用唯一列将它们合并在一起。字段名称不同,因此concat退出了。 我可以手动使用等将每个df逐一合并,但是问题是列表中数据帧的数量随用户输入而不同。 有什么合并方法可以一次性将所有数据帧合并到一个列表中?还是某些for in loop? 我正在使用Python 2.7。 问题答案: 您可以使用函数where是数据
问题内容: 这是我正在运行的代码的一个简单示例,我希望将结果放入pandas数据框中(除非有更好的选择): 使用此代码: 我可以得到: 这是一个1x3的数据帧,我理解 为什么 它只有一行,但是我不知道如何使列以正确的顺序变为多行。理想情况下,该解决方案将能够处理 n 行(基于p),并且如果列数由请求的统计数来设置,那将是很棒的(尽管不是必须的)。有什么建议?提前致谢! 问题答案: 使用列表理解尝试
问题内容: 我一直在寻找通过python文档和论坛选择列的方法,但是索引列的每个示例都过于简单。 假设我有一个10 x 10的数据帧 到目前为止,所有文档都提供了一个简单的索引编制示例,例如 要么 但是当我尝试索引多个非连续列时出现错误 如果要选择A到C,E和G到我列,如何在Pandas中建立索引?看来这种逻辑将不起作用 我觉得解决方案非常简单,但是我无法解决此错误。谢谢! 问题答案: 基于名称或
问题内容: 我有一个数据框,类似: 我想在数据框的末尾添加一个“总计”行: 我尝试使用该命令,但最终得到一个Series,尽管可以将其转换回Dataframe,但它不维护数据类型: 我想维护原始数据帧中的数据类型,因为我需要对总行应用其他操作,例如: 问题答案: 将总计行附加到 仅当您有一列字符串或对象时,才需要进行转换。 这是一个脆弱的解决方案,因此我建议仍然坚持对数据框进行操作。例如。
问题内容: 如果要计算熊猫中两个类别的平均值,可以这样进行: 我有很多这样格式化的数据,现在我需要做一个 T 检验,看看 cat1 和 cat2的均值 在统计上是否不同。我怎样才能做到这一点? 问题答案: 它取决于您要进行哪种t检验(单侧或双侧相关或独立),但是它应该很简单: 它返回一个带有t统计量和p值的元组 有关其他t检验,请参见此处http://docs.scipy.org/doc/scip
问题内容: 这是我的数据框,应重复5次: 我想要这样的结果: 但是必须有一种比保持追加更聪明的方法。实际上,Im正在处理的数据帧应重复50次。 我还没有发现任何实用的东西,包括类似-—的东西,但它在数据框架上不起作用。 有人可以帮忙吗? 问题答案: 您可以使用以下功能: 如果只想重复值而不是索引,则可以执行以下操作:
问题内容: 我需要将DataFrame中除第一列之外的所有列除以第一列。 这是我正在做的事情,但我想知道这是否不是“正确的”熊猫方式: 有没有办法做类似的事情?(这只是给出了一个10x12的数据框。) 另外,在阅读了关于SO的一些类似问题之后,我尝试了一下,但是给出了广播错误。 问题答案: 我相信并工作。
问题内容: 我希望在python3中以有效的方式使用该功能。我拥有的代码可以完成任务,但是速度太慢,因为我正在处理大型数据集。因此,只要有折衷,我的工作重点就是效率而不是优雅。这是我想做的玩具: 这使 如我所愿,但是花费的时间太长了。最快的方法是什么? 编辑:这是比该问题更集中和明确的问题,其解决方案与此类似。 问题答案: 用于执行查找: 为了避免没有有效密钥的情况,您可以通过 您还可以使用回答有
问题内容: 假设我有一个类似于下面的数据框,我将如何获取2个特定列之间的相关性,然后按“ ID”列分组?我相信Pandas的“ corr”方法可以找到所有列之间的相关性。如果可能的话,我也想知道如何使用.agg函数(即np.correlate)找到“ groupby”相关性。 是)我有的: 我需要的: 谢谢! 问题答案: 您几乎已经弄清楚了所有部分,只需将它们结合起来即可: 在您的情况下,为每个I
问题内容: 假设我有以下DataFrame: 这按预期工作: 但这不是: 为什么?我如何在不必写两行的情况下实现“苹果”和“香蕉”值的转换 问题答案: 您应该使用loc, 而无需链接 : 请参阅有关 返回视图与副本的文档,如果将链接分配给副本(并丢弃),但是如果将它分配给一个位置,则大熊猫会聪明地意识到您想要分配给原始副本。
问题内容: 我有一个要存储’raw’的数据框: 但似乎试图“解压” numpy.array。 有解决方法吗?除了使用包装器之外(请参见下面的编辑)? 我尝试没有成功。 编辑 这行得通,但是我必须使用’dummy’类来包装数组,这不能令人满意,也不是很优雅。 问题答案: 在numpy数组周围使用包装器,即将numpy数组作为列表传递 输出: 或者您可以通过创建元组来使用,即如果您有一个数据框 输出:
问题内容: 这听起来可能是个菜鸟问题,但由于Python不是我最好的语言之一,所以我坚持使用它。 我有一个html页面,里面有一个表格,我想在其中显示一个pandas数据框。最好的方法是什么?使用pandasdataframe.to_html? py html 问题答案: 工作示例: python代码: HTML: 否则使用 并从html中删除行 如果您检查html上的元素 如您所见,表格html
问题内容: 我有一个包含多个表的数据库,并且我试图将每个表作为pandas数据框导入。我可以对单个表执行以下操作: 数据库中表的数量将发生变化,并且我希望能够随时将每个表导入其自己的数据框中。如何将所有这些桌子放入大熊猫中? 问题答案: 根据您的SQL Server,您可以检查数据库中的表。 例如: 现在您可以将表名作为pandas数据框访问,您只需解析一下即可: 您的字典包含所有以table_n
问题内容: 我有以下名为“ data.csv”的文件: 我想将其解析为一个熊猫DataFrame,以便DataFrame如下所示: 我能做的最好的事情是: 这让我: 没有这些空格的如何获取DataFrame? 问题答案: 您可以使用转换器: 产量
问题内容: 我正在从Excel文件中解析数据,该文件在某些列标题中具有额外的空白。 当我使用来检查结果数据框的列时,我看到: 因此,我无法执行以下操作: 因为它会告诉我找不到列,因为我要求输入“ Month”而不是“ Month”。 那么,我的问题是如何从列标题中去除不需要的空白? 问题答案: 您可以为该方法提供功能。该方法应做您想要的。 注意 :这将返回一个对象,并在屏幕上显示为输出,但是更