问题内容: 我有以下索引的DataFrame,其中的命名列和行不是连续数字: 我想在现有数据框架中添加新列,并且不想更改数据框架中的任何内容(即,新列的长度始终与DataFrame相同)。 我尝试了不同的版本,但我没有得到我想要的,最多只是错误的结果。如何e在上面的示例中添加列? 问题答案: 使用原始的df1索引创建系列: 编辑2015年 有些人报告使用此代码。 但是,该代码仍可以在当前的熊猫0.
问题内容: 我对知道如何将熊猫数据框转换为NumPy数组感兴趣。 数据框: 给 我想将其转换为NumPy数组,如下所示: 我怎样才能做到这一点? 作为奖励,是否可以像这样保留dtype? 或类似的? 问题答案: 要将pandas数据框(df)转换为numpy ndarray,请使用以下代码:
问题内容: 我在不同的列中有数据,但是我不知道如何提取数据以将其保存在另一个变量中。 如何选择然后将其保存到df1中? 我试过了 似乎没有任何工作。 问题答案: 列名(字符串)无法按照你尝试的方式进行切片。 在这里,你有两个选择。如果从上下文中知道要切出哪些变量,则可以通过将列表传递给语法来仅返回那些列的视图。 或者,如果需要对它们进行数字索引而不是按其名称进行索引(例如,你的代码应在不知道前两列
问题内容: 尝试从计算中创建新列。在下面的代码中,我获得了每个日期的正确计算值(请参阅下面的组),但是当我尝试用它创建一个新列()时,我得到了NaN。因此,我正在尝试在数据框中使用Data3所有日期的总和创建一个新列,并将其应用于每个日期行。例如,2015-05-08位于2行中(总计为),在这个新列中,我希望两行中都具有55。 问题答案: 你要使用此方法将返回索引与df对齐的,然后可以将其添加为新
问题内容: 有没有这将是一个组合的等同的任何功能和? 例如,假设我有系列 ,并且我想找到s包含的任何一个的所有地方,那么我想得到除“宠物”以外的所有东西。 我有一个解决方案,但这很不雅致: 有一个更好的方法吗? 问题答案: 一种选择是仅使用正则表达式|字符尝试匹配系列中单词中的每个子字符串s(仍使用)。 你可以通过将单词与结合在一起来构造正则表达式|: 就像在下面的注释中指出的那样,请注意你的子字
问题内容: 我的第一个SO问题:我对在熊猫(0.12.0-4)中groupby的apply方法的这种行为感到困惑,它似乎将TWICE函数应用于数据帧的第一行。例如: 我首先检查groupby函数是否可以正常工作,这似乎很好: 然后,我尝试对groupby对象应用apply来执行类似的操作,并且两次获得第一行输出: 任何帮助,将不胜感激!谢谢。 编辑:@Jeff提供以下答案。我很忙,并没有立即理解它
问题内容: 我在DataFrame中有一列带有值: 如何将它们这样分组? 问题答案: 你可以groupby通过自定义使用:
问题内容: 我从这样的输入数据开始 打印时显示为: 分组非常简单: 打印产生一个对象: 但是我最终想要的是另一个DataFrame对象,该对象包含GroupBy对象中的所有行。换句话说,我想得到以下结果: 我在pandas文档中看不到如何完成此操作。任何提示都将受到欢迎。 问题答案: 这是一个。但是,它具有层次结构索引: 也许你想要这样的东西? 或类似的东西:
问题内容: 这是我的生成数据框的代码: 然后我得到了数据框: 当我输入命令时: 我有 : 根据熊猫的参考,代表列,我希望命令的结果是 所以这是我的问题:大熊猫轴是什么意思? 问题答案: 它指定轴沿其的装置被计算的。默认情况下。这与显式指定时的用法一致(默认情况下为,轴,该值将计算扁平化数组的平均值),沿行(即,以pandas为索引)和沿列。为了更加清楚起见,可以选择指定(代替)或(代替)。
问题内容: 我有一个pandas数据框,我想将其写入CSV文件。我正在使用以下方法: 并得到错误: 有什么方法可以轻松解决此问题(即我的数据框中有Unicode字符)吗?有没有一种方法可以使用例如“ to-tab”方法(我认为不存在)写入制表符分隔文件而不是CSV? 问题答案: 要用制表符分隔,可以使用参数: 要使用特定的编码(例如),请使用参数:
问题内容: 你是否知道如何以NumPy数组或python列表的形式获取DataFrame的索引或列? 问题答案: 要获取NumPy数组,应使用以下属性: 这样可以访问数据的存储方式,因此无需进行转换。 注意:此属性也可用于其他许多熊猫的对象。 要将索引作为列表获取,请致电tolist: 同样,对于列。
问题内容: 我有一个这样的数据框: Calling 将返回 现在,我想对列“ C”执行“相同”操作。因为该列包含字符串,所以sum()不起作用(尽管您可能认为它将字符串连接在一起)。我真正想看到的是每个组的字符串列表或一组字符串,即 我一直在尝试找到方法来做到这一点。 尽管Series.unique()(http://pandas.pydata.org/pandas-docs/stable/gen
问题内容: 我一直在寻找一种方法,用DataFrame中的四舍五入的数值在Pandas条形图中标注条形。 我想得到这样的东西: 我尝试使用此代码示例,但所有注释均以x刻度为中心: 问题答案: 你可以直接从轴的补丁中获取它: 你可能需要调整字符串格式和偏移量以使内容居中,也许使用from的宽度·,但这应该可以帮助你开始。除非你在某处跟踪偏移量,否则它可能不适用于堆积的条形图。
问题内容: 即: 输出是相同的。 这个答案适用于这种情况吗? 问题答案: “点符号”,即为方便起见公开的属性访问。 你可以直接作为属性访问“系列”上的索引,“数据框架”上的列以及“面板”上的项目: 做同样的事情:它返回列的。 关于属性访问的一些警告: 你无法添加列(将无法正常工作,更糟的是:它会默默地实际上创建一个新属性而不是一个列-请在此处进行猴子修补) 如果列名中有空格或列名是整数,则将无法使
问题内容: 我有一个包含四列的。我想将此DataFrame转换为python字典。我希望第一列的元素为,同一行中其他列的元素为。 数据框: 输出应如下所示: 字典: 问题答案: 该方法将列名设置为字典键,因此你需要稍微调整DataFrame的形状。将“ ID”列设置为索引,然后转置是实现此目的的一种方法。 还接受一个“东方”参数,你需要该参数才能为每列输出值列表。否则,将为每一列返回形式的字典。