我想用下面的数据绘制一个线性分布(Employee和days代表月份(1代表一月,以此类推)。为了将数据转换成正确的形式,我将其转置。但是我不知道如何访问x参数来绘制。
df=pd.DataFrame({'Empl': ['Jon','Don','Joe'], '1': [40, 50, 10], '2': [20,45,5], '3': [15,0,2], '4': [0,0,0]})
df_T = df.set_index('Empl').T
display(df)
display(df_T)
两个数据流的输出为:
现在我不知道如何绘制/访问dataframe中的第1列以设置plt.plot函数的第一个参数:
plt.plot( '???', 'Empl', data=df_T, marker='o', markerfacecolor='blue', markersize=12, color='skyblue', linewidth=4)
非常感谢
第一列是索引,因此可以使用dataframe.plot
:
df_T.plot( marker='o', markerfacecolor='blue', markersize=12, color='skyblue', linewidth=4)
我正在改装一些现有代码以使用Spark。我有多个包含不同数据集的数据帧。在转换主数据帧(或主数据集)时,我需要使用来自其他数据帧的数据来完成转换。我还有一种情况(至少在当前结构中),我需要在另一个数据帧的转换函数中创建新的数据帧。 我试图确定以下内容: 我可以在另一个数据帧的转换函数中访问数据帧吗 关于如何处理这种情况的指针将非常有帮助。
我有这种熊猫。数据框。“a”、“b”是获得“x”和“y”时的条件。 我需要绘制关于相同条件的(x,y)结肠的折线图。预期结果图为: 当然,这个图像是由以下代码手动给出的: 我的问题是,当获得一个包含条件列x和y的数据帧时,如何动态地绘制如上所述的图。 列名是固定的。但是,条件列的值是动态更改的。因此,我不能使用10、20、100、200的值。 如果我有下面的“用a和b过滤”方法,我认为问题解决了:
所有, 我有一个类似这样的df 要访问我要查找的号码,我执行了以下操作: 然而,输出是 但是我要找的是,没有列名和索引。 任何想法都是受欢迎的 谢谢
我有一个数据框架,其中有2列。第一列似乎没有列名,第二列名为< code>Speed。 这是一个MRE: 这是我执行打印语句时的输出: 这是我想要的输出:
我对访问中的数据的几种方法进行了比较。请参阅下面的结果。最快的访问是在上使用方法。在这篇文章中提到了我。 令我惊讶的是,通过访问比通过底层的 numpy 对象 访问更快。 我的问题是,有没有一种方法可以像我通过< code>get_value访问熊猫数据帧一样快速地访问numpy数组的元素? 10000个回路,最佳3:108µs/回路 最慢的运行时间是最快的5.42倍。这可能意味着正在缓存中间结果
情况: 两个数据帧(df1和df2)具有相同的三个索引,例如“A”、“B”、“C”。df1和df2的列数不同。df1和df2中的所有单元格都填充了float类型的数据。 DF1: DF2: 目标: 从df2中选择的列(例如“BBB”)与df1的每列相加后,结果应存储在新的数据帧(df_new)中。df_new的格式应为df1(列数和行数),并具有与df1相同的列名和索引。 new_df: 我的做法