直接将表放入数据帧时出现错误“OverflowerError:long int太大,无法转换”。这似乎是由于表中包含了大量的数字,但尝试使用时没有错误https://www.pythonanywhere.com/try-ipython/.我添加了一个变通方法,将值转换为float,然后创建了数据帧。
import pandas as pd
table = [{'two': 2, 'one': 1}, {'two': 22, 'one': 11},
{'two': 222, 'one': 1111111111111111111111111111111111111111111111111111111111111111111111}]
# workaround for overflow error
for x, i in enumerate(table):
table[x]['one']=float(table[x]['one'])
df = pd.DataFrame(table)
有更好的方法吗?其他人指出,他们没有得到任何溢出错误。这是Python2.7
默认情况下,pandas尝试读取和理解数据,并将其转换为适当的数据类型。在您的例子中,它试图将数据加载到np中。浮动64
对象。但是,您的数据显然太大了。
一种解决方法是在创建数据帧时指定dtype=object
。
df = pd.DataFrame(table, dtype='object')
df
one two
0 1 2
1 11 22
2 1111111111111111111111111111111111111111111111... 222
请注意,这样做会降低速度和效率的所有可能性,因为object
s的处理速度非常慢。我想你已经准备好了,处理这种性质的数据。
我需要从不同的字典中创建一个熊猫数据框架,其中键必须作为数据框架内的列名。如果数据帧没有将键列为列,则必须动态创建键,并将其作为新列附加到数据帧。 我希望输入为, 输出应该是,, 循环的第一次迭代将键作为数据框的列名称,如果没有数据框,则创建值作为第一行的数据框。 第二次迭代检查键是否作为列出现在数据帧中,如果已经出现则插入,否则创建列并插入值作为第二行。 我确实不知道如何在python中动态运行
拿着字典: 我如何把这个字典变成一个数据框,其中的值是列?即。我想要一个数据框显示: 这种形式似乎根本得不到! 谢谢 这是一个不同的问题,另一个问题只是问如何将字典的值放入数据帧,我问的是如何获得我概述的特定形式
字典的键是日期,值是一个长度不同的列表 例如,字典是 我想要的是像这样的数据帧
我有一个包含几个pandas数据帧(由键标识)的dict,任何有效序列化(和干净加载)它的建议。下面是结构(一个pprint显示输出)。每个DICT['method_x_']['meas_x_']都是一个pandas数据帧。我们的目标是保存数据流,以便使用一些特定的绘图选项进行进一步的绘图。 {“Method1”: {“Meas1”: “方法2”: {“Meas1”: “Meas2”:
我有一本字典的形式: 例如, 我想转换成熊猫数据帧与列1的用户名和其他列的电影评级,即: 但是,一些用户没有对电影进行评分,因此这些电影不包括在该用户键()的值()中。在这种情况下,只需用NaN填充条目就好了。 现在,我迭代键,填充列表,然后使用此列表创建数据帧: 但这只给了我一个用户的数据框,这些用户对片场中的所有电影都进行了评分。 我的目标是通过迭代电影标签(而不是上面显示的暴力方法)来追加到
问题内容: 我想从值中创建一个字典,我从excel单元中获取,我的代码如下, 我想创建一个字典,如下所示,其中包含来自excel单元格的值; 关于如何创建此字典的任何想法吗? 问题答案: