我有以下数据:
data = pd.DataFrame().from_dict([r for r in response])
print data
_id total
0 213 1
1 194 3
2 205 156
...
现在,如果我打电话:
data.hist()
我将得到两个单独的直方图,每列一个。这不是我想要的。我想要的是使用这两列生成一个直方图,其中一列被解释为一个值,另一列被解释为该值的多次出现。我应该如何生成这样的直方图?
我试过:
data.hist(column="_id", by="total")
但这会生成更多带有错误信息的(空)直方图。
由于您已经计算了bin频率(总计列),所以只需使用熊猫即可。数据帧。绘图
data.plot( x='_id', y='total', kind='hist')
您始终可以转到较低级别的matplotlib。历史记录
:
from matplotlib.pyplot import hist
df = pd.DataFrame({
'_id': np.random.randn(100),
'total': 100 * np.random.rand()
})
hist(df._id, weights=df.total)
问题内容: 我有一个熊猫,其中有多个列: 其中和是包含相同数据但名称不同的列。有没有一种方法可以将组成行的行移动到理想状态,同时保持名称? 最后,DataFrame应该显示为: 那就是构成bar的NaN值被替换为的值。 问题答案: 尝试这个: 如果您希望该数据成为新列,只需将结果分配给即可。
问题内容: 假设我有一个数据框如下 现在,我希望a和b列不同的行。所以预期的输出是 我怎样才能做到这一点? 问题答案: 我喜欢可读性,请使用: 输出:
问题内容: 我已经看到了将一个列/系列分解为Pandas数据框的多个列的主题的几种变体,但是我一直在尝试做点事情,而实际上并没有成功地使用现有方法。 给定这样的一个DataFrame: 我想将系列中的项目转换为以值作为值的列,如下所示: 我觉得这应该是相对简单的事情,但是由于卷积水平的提高,我已经为此花了几个小时不停地努力,但没有成功。 问题答案: 有几种方法: 使用: 使用: 使用后跟:
问题内容: 我有一个包含多个列的数据集,我希望对其进行一次热编码。但是,我不想为每个编码都有编码,因为所说的列与所说的项目有关。我想要的是一组使用所有列的虚拟变量。请参阅我的代码以获得更好的解释。 假设我的数据框如下所示: 如果我执行 输出将是 但是,我想获得的是这样的东西: 代替具有表示编码,例如多列的和,我只希望有一组(,,等等)与值时任何在列中的值的,,显示出来。 需要说明的是,在我的原始数
我正在尝试对两个熊猫数据框列进行排序。我知道Python有自己的内置函数: 但我想知道熊猫是否也有这个功能,是否可以将两列作为一对一起完成。 例如,我有以下数据集: 我想获得以下信息: 基本上我在这里做的是,我正在对列“特征”进行排序,以从最小值到最大值,但是我希望“总和”中的相应值也发生变化。 有人能帮我解决这个问题吗?我在Stackoverflow上看到过其他帖子,但是我没有找到解释这个过程的
我试图生成‘小提琴’一样的条形图,但我运行在几个困难中描述了下面······ 将“label”添加为要共享的两个图表的标签时遇到麻烦。 使两幅图之间的标签居中(以及在每个条的垂直中心) 只保留外部yaxis上的刻度(而不是标签要去的内部)