我使用dataframe.to_html
函数将pandas数据帧转换为html输出。当我将其保存到一个单独的html文件中时,该文件将显示截断的输出。
例如,在“我的文本”列中,
df.head(1)
将显示
这部电影是一部出色的作品…
而不是
这部电影是解构这一时期盛行的复杂社会情绪的一次极好的努力。
这种呈现对于屏幕友好格式的大量pandas dataframe是很好的,但是我需要一个html文件来显示包含在dataframe中的完整的表格数据,也就是说,它将显示后一个文本元素而不是前一个文本片段。
如何在html版本的信息中显示文本列中每个元素的完整的、未截断的文本数据?我认为html表必须显示长单元格以显示完整的数据,但据我所知,只有列宽参数可以传递到dataframe.to_html
函数中。
将display.max_colwidth
选项设置为none
(或1.0版本之前的-1
):
pd.set_option('display.max_colwidth', None)
set_option
文档
例如,在iPython中,我们看到信息被截断为50个字符。任何超出的部分都是椭圆形的:
如果设置display.max_colwidth
选项,则信息将完全显示:
我使用函数将熊猫数据框转换为HTML输出。当我将其保存到一个单独的HTML文件时,该文件将显示截断的输出。 例如,在我的文本栏中, 将显示 这部电影是一个很好的努力... 而不是 这部电影在解构这一时期盛行的复杂社会情绪方面做出了卓越的努力。 对于大熊猫数据框的屏幕友好格式,这种格式转换很好,但我需要一个HTML文件,它将显示数据框中包含的完整表格数据,也就是说,它将显示后一个文本元素,而不是前一
问题内容: 我的问题与此非常相似,但是我需要转换整个数据框,而不仅仅是转换一系列数据框。该功能一次只能在一个系列上使用,不能很好地替代不推荐使用的命令。有没有办法获得与新熊猫版本中的命令相似的结果? 谢谢MikeMüller的示例。如果所有值都可以转换为整数,则效果很好。如果在我的数据帧中我有无法转换为整数的字符串怎么办?例: 然后,我可以运行不赞成使用的函数并获取: 运行命令会给我错误,即使尝试
我正在尝试将熊猫DF转换为Spark one。测向头: 代码: 我得到了一个错误:
我有以下两个场景共享的前奏代码: 现在,我想将df转换为pyspark数据帧(
我有一个需要一个数据帧作为输入的计算。我想对存储在扩展到51GB的netCDF文件中的数据运行此计算-目前,我一直在使用打开文件,并使用块(我的理解是,此打开的文件实际上是一个dask数组,因此一次只能将数据块加载到内存中)。但是,我似乎无法利用这种延迟加载,因为我必须将xarray数据转换为pandas数据帧才能运行我的计算——我的理解是,在这一点上,所有数据都加载到内存中(这是不好的)。 所以