问题：

从pandas创建h2o数据帧和unicode错误

张星洲

2023-03-14

import h2o
import pandas as pd

df = pd.DataFrame({'col1': [1,1,2], 'col2': ['César Chávez Day', 'César Chávez Day', 'César Chávez Day']})
hf = h2o.H2OFrame(df)  #gives error

环境：Python 3.5,h2o 3.10.4.2

共有1个答案

雍焱

2023-03-14

我同意这不是一个特定于H2O的问题。这对我起作用（相同的H2O和Python版本）：

import h2o
import pandas as pd

df = pd.DataFrame({'col1': [1,1,2], 'col2': ['César Chávez Day', 'César Chávez Day', 'César Chávez Day']})
hf = h2o.H2OFrame(df)

## -- End pasted text --
Parse progress: |█████████████████████████████████████████████████████████| 100%

In [4]: hf
Out[4]:   col1  col2
------  ----------------
     1  César Chávez Day
     1  César Chávez Day
     2  César Chávez Day

[3 rows x 2 columns]

In [5]: type('César Chávez Day')
Out[5]: str

我的规格（您可能需要更改默认编码）：

In [6]: import sys

In [7]: sys.getdefaultencoding()
Out[7]: 'utf-8'

这个线程可能会有帮助：我如何检查一个字符串是unicode还是ASCII？

类似资料：

使用scipy.sparse从pandas数据帧创建稀疏矩阵

我有一个带有两个变量X和Y的pandas数据帧（大约1M行），并且希望使用scipy,sparse创建一个稀疏矩阵。输出应该是一个n x m矩阵，如果x=x和Y=Y，则其条目为1。下面是数据结构的示例所需的输出为提前致谢
将Pandas数据帧转换为Spark数据帧错误

我正在尝试将熊猫DF转换为Spark one。测向头：代码：我得到了一个错误：
从字典集创建数据帧

我需要从不同的字典中创建一个熊猫数据框架，其中键必须作为数据框架内的列名。如果数据帧没有将键列为列，则必须动态创建键，并将其作为新列附加到数据帧。我希望输入为，输出应该是,，循环的第一次迭代将键作为数据框的列名称，如果没有数据框，则创建值作为第一行的数据框。第二次迭代检查键是否作为列出现在数据帧中，如果已经出现则插入，否则创建列并插入值作为第二行。我确实不知道如何在python中动态运行
从列创建的数据帧索引

我有一个数据框，我正在使用TIA来填充彭博社的数据。当我看着df。索引我看到我打算成为列的数据以多索引的形式呈现给我。df的输出。列是这样的：索引（[u'column1'，'u'column2']）我尝试过各种reset_index的迭代，但都无法补救这种情况。 1） TIA管理器如何使数据帧列作为索引读入？ 2）如何正确地将这些列标识为列而不是多索引？我试图解决的最终问题是，当我尝试将此
熊猫从循环创建数据帧

我正在尝试制作一个数据帧，以便可以轻松地将其发送到CSV，否则我必须手动执行此过程。。我希望这是我的最终输出。每个人都有一个月和年的组合，从2014年1月1日开始，一直到2016年1月12日：到目前为止的代码：当我尝试循环创建数据帧时，它要么不工作，要么出现索引错误（因为不匹配列表），我不知所措。我已经做了一点很好的搜索，并找到了以下一些类似的链接，但我不能反向工程的工作，以适应我的情况。
熊猫：从字典创建数据帧

拿着字典：我如何把这个字典变成一个数据框，其中的值是列？即。我想要一个数据框显示：这种形式似乎根本得不到！谢谢这是一个不同的问题，另一个问题只是问如何将字典的值放入数据帧，我问的是如何获得我概述的特定形式

从pandas创建h2o数据帧和unicode错误

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档