当前位置: 首页 > 知识库问答 >
问题:

Dask:AttributeError:“DataFrame”对象没有属性“\u getitem\u array”

韩恺
2023-03-14

我有一些关于S3 bucket的数据要处理。

我已经导入它使用:

import boto3
import dask.dataframe as dd

def import_df(key):
        s3 = boto3.client('s3')
        df = dd.read_csv('s3://.../' + key ,encoding='latin1')
        return df

key = 'Churn/CLEANED_data/file.csv'
train = import_df(key)

我可以看到数据已使用以下方法正确导入:

train.head()

但是当我尝试简单的操作时(取自此dask文档):

train_churn = train[train['CON_CHURN_DECLARATION'] == 1]
train_churn.compute()

我有个错误:

()

1列车搅拌=列车[列车['CON\U搅拌声明']==1]

----

~/anaconda3/envs/python3/lib/python3。6/现场包/dask/基地。计算中的py(自,**kwargs)152 dask。基础计算153“”--

DataFrame对象没有属性_getitem_array

完全错误:错误上传

共有3个答案

潘阳舒
2023-03-14

您可能有一个旧版本的dask。安装版本2.13。0为我修复了此问题。

赫连棋
2023-03-14

如果是“CON_-chorn_-DECLARATION”上的行选择,您应该能够使用以下内容过滤数据帧:

train_churn = train[train.CON_CHURN_DECLARATION==1]
訾高明
2023-03-14

当我试图从s3文件读取时,我面临着类似的问题,最终通过将dask更新到最新版本来解决(我认为默认情况下开始的sagemaker实例不建议使用)

! python -m pip install --upgrade dask
! python -m pip install fsspec
! python -m pip install --upgrade s3fs

希望这能有所帮助!

 类似资料:
  • 问题内容: 我在这里遇到一些问题,在我的python包中,我已经安装了numpy,但是我仍然 遇到 此错误 ‘DataFrame’对象没有属性’sort’ 任何人都可以给我一些想法。 这是我的代码: 问题答案: 不推荐使用DataFrames,而采用以下两种方法之一: 到 由列排序(S) 要 通过索引排序 在Pandas中已弃用(但仍可用)版本0.17(2015-10-09),并引入和。它已从0.

  • 我在这里遇到了一些问题,在我的python包中,我安装了,但是我仍然有这个错误: “DataFrame”对象没有属性“sort” 任何人都可以给我一些想法。。 这是我的代码:

  • 问题内容: 我想转换火花数据框架以使用以下代码添加: 详细的错误消息是: 有人知道我在这里做错了吗?谢谢! 问题答案: 您无法使用数据框,但可以将数据框转换为RDD并通过映射将其映射。在Spark 2.0之前,别名为。使用Spark 2.0,您必须先明确调用。

  • 当我尝试使用时,出现此错误。用于拉出列的数据帧的ix属性,例如。 这个脚本今天早上还能用,但是今天下午我在一个新的Linux环境中运行了它,安装了新的熊猫。以前有人见过这个错误吗?我找遍了这里和其他地方,但没找到。

  • 问题内容: 我正在尝试过滤出包含产品列表的数据框。但是,我遇到了熊猫-每当我运行代码时,“ dataframe”对象都没有属性“ str”错误。 这是代码行: 如果有人有任何建议的想法,请告诉我。我已经搜索了很多次,而且非常困惑。 产品是对象数据类型。 编辑: 这是头: 编辑2:这是print(data),A是产品。当我将其打印出来时,看起来好像A不在类别产品下。 问题答案: 答案很简单: 改变成

  • 下面的代码以前对我有用,但现在不行了。我得到了错误: AttributeError:“DataFrame”对象没有属性“to df”