查看以下数据帧时出现问题
:
n = 100
foo = DataFrame(index=range(n))
foo['floats'] = np.random.randn(n)
foo
问题是它不会在ipython笔记本中按默认值打印所有行,但我必须切片才能查看结果行。即使以下选项也不会更改输出:
pd.set_option('display.max_rows', 500)
有人知道如何显示整个阵列吗?
pd.set_option('display.max_rows', 500)
df
在Jupyter不工作
改用:
pd.set_option('display.max_rows', 500)
df.head(500)
就我个人而言,我喜欢直接用赋值语句设置选项,因为多亏了iPython,通过制表符补全很容易找到。我发现很难记住确切的选项名称,所以这个方法对我很有效。
例如,我所要记住的是它以pd开头。选项
pd.options.<TAB>
大多数选项在display
pd.options.display.<TAB>
从这里,我通常输出当前值如下:
pd.options.display.max_rows
60
然后我将其设置为我想要的:
pd.options.display.max_rows = 100
此外,您应该知道选项的上下文管理器,它临时设置代码块中的选项。将选项名称作为字符串传入,后跟您希望的值。您可以在同一行中传递任意数量的选项:
with pd.option_context('display.max_rows', 100, 'display.max_columns', 10):
some pandas stuff
您还可以将选项重置回其默认值,如下所示:
pd.reset_option('display.max_rows')
并重新设置所有这些参数:
pd.reset_option('all')
通过pd.set_option
设置选项仍然非常好。我只是发现直接使用属性更容易,并且不需要get_option
和set_option
。
设置显示。最大行数
:
pd.set_option('display.max_rows', 500)
对于旧版本的熊猫(
pd.set_option('display.height', 500)
pd.set_option('display.max_rows', 500)
另见pd。描述_选项(“显示”)
。
您可以设置一个选项只有暂时为这一次像这样:
from IPython.display import display
with pd.option_context('display.max_rows', 100, 'display.max_columns', 10):
display(df) #need display to show the dataframe when using with in jupyter
#some pandas stuff
您还可以将选项重置回其默认值,如下所示:
pd。重置选项('display.max_rows')
并重新设置所有这些参数:
pd。重置选项(“全部”)
问题内容: 我有一个包含屏幕名称,tweet,收藏夹等的Pandas DataFrame。我想找到“ favcount”(我已经做过)的最大值,并返回该“ tweet”的屏幕名称 我似乎找不到任何东西,任何人都可以帮助我朝正确的方向发展吗? 问题答案: 使用 来获取最大价值的指标。那你可以用 编辑: 现已弃用,切换为
从0.13版本开始,可以通过引用尚未在数据帧中的. loc或. ix中的索引来追加到数据帧。看到留档。 那么我就不明白为什么这条线失败了: 这将生成ValueError: 这里是所有的治疗方法。形状=(53,12),,,,。 在这里设置放大的正确方法是什么?
我有一个数据帧,如: 所以我想通过两个“for循环”添加一些列,如: 新的类似数据帧的图片: 我的代码不起作用: 如何编写代码来获得像第二张图片这样的数据帧?
我正在读取一个包含多个datetime列的csv文件。我需要在读取文件时设置数据类型,但datetimes似乎是个问题。例如: 运行时出现错误: 不理解数据类型"datetime" 通过pandas在事实之后转换列。to_datetime()不是一个选项,我不知道哪些列将成为datetime对象。这些信息可以更改,并且来自于通知我的数据类型列表的任何信息。 或者,我尝试用numpy.genfrom
问题内容: 我有一个数据框,看起来像: 我希望按年份分组,然后总结sum_col。此外,我需要查找一周的最早日期和最新日期。第一部分很简单: 我试图用这个来找到最小/最大日期,但是没有成功: 如何找到最早/最新出现的日期? 问题答案: 您需要组合适用于同一列的函数,如下所示:
问题内容: 我有两列,将集存储在数据框中。 我想使用快速向量化操作在两列上执行集合并集 但是错误使我无法这样做,因为我在两列中都输入了内容。 有解决这个问题的好方法吗? 问题答案: 对于这些操作,纯Python可能更有效。 如果我们可以使用,则可能会花费一半的时间(继承可能不值得): 时序的DataFrame: