我需要创建一个具有特定形状的空数据框,例如[10,10],以存储来自其他源的数据。
在熊猫中很简单:
pd.DataFrame(np.nan, index=range(10), columns=range(10))
但在红宝石使用达鲁,我不知道如何做到这一点。
相关问题:熊猫数据帧
您可以在:order
选项中传递向量名称,并在:index
选项中传递范围作为索引。输入将是一个空的数组
。
例如:
require 'daru'
df = Daru::DataFrame.new([], order: (1..4).to_a, index:(0..10).to_a)
# =>
#<Daru::DataFrame:72941700 @name = 2357edc1-f425-4ae3-aead-5a8b812ecb13 @size = 11>
# 1 2 3 4
# 0 nil nil nil nil
# 1 nil nil nil nil
# 2 nil nil nil nil
# 3 nil nil nil nil
# 4 nil nil nil nil
# 5 nil nil nil nil
# 6 nil nil nil nil
# 7 nil nil nil nil
# 8 nil nil nil nil
# 9 nil nil nil nil
# 10 nil nil nil nil
我想创建一个熊猫的数据frame充满了南。在我的研究中,我找到了一个答案: 此代码将生成一个用类型为“Object”的NaNs填充的DataFrame。因此以后不能使用它们,例如方法。因此,我用这段复杂的代码创建了DataFrame(灵感来自这个答案): 这将产生一个用类型为“float”的NaN填充的DataFrame,因此以后可以与一起使用。有没有更优雅的方法来创建同样的结果?
我得到了一个具有多个列和行的数据帧df1。简单的例子: 我想创建一个空的数据框df2,然后再添加新的列和计算结果。 此时,我的代码如下所示: …添加两个新列: 有没有更好/更安全/更快的方法?是否可以创建一个空数据帧df2,并且只从df1复制索引?
因为xv中的值可能会改变,xv中的条目数也可能改变,所以我需要能够使用函数来做到这一点? 你知道我怎么做吗?
我想做的是... 但是这并不完全有效,因为colSums()的结果不是数据帧。如果我投了它,它就起作用了: 但最后做(...)比特似乎很笨拙。 我没有费心进行复制,只是使用system.time()获得了一个粗略的度量。从外观上看,dplyr和data.table在我的数据集上的表现大致相同,而且如果使用得当,两者都比我昨天提出的hack解决方案要快得多。
我试图训练一个数据集来预测输入的文本是否来自科幻小说。我对python比较陌生,所以我不知道我到底做错了什么。 代码: 错误:回溯(最近一次呼叫上次): 文件“”,第1行,在main()中 文件"C:/用户/用户/桌面/分配/SQL /Python/DA项目/class17.py",第36行,在主model_novels() modelêselectedModel中的文件“C:/Users/use
我有一个数据框,我正在使用TIA来填充彭博社的数据。当我看着df。索引我看到我打算成为列的数据以多索引的形式呈现给我。df的输出。列是这样的: 索引([u'column1','u'column2']) 我尝试过各种reset_index的迭代,但都无法补救这种情况。 1) TIA管理器如何使数据帧列作为索引读入? 2) 如何正确地将这些列标识为列而不是多索引? 我试图解决的最终问题是,当我尝试将此