当前位置: 首页 > 知识库问答 >
问题:

键错误:“列中没有[Int64Index…]dtype='int64]”

宣熙云
2023-03-14

法典:-

import os
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt


class Vizualizer:

    def __init__(self,data,cols):
        self.data=data
        self.cols=cols

    def box_plot(self):
            for col in self.cols:
                sns.boxplot(x=col,y='Ex-Showroom_Price',data=self.data[self.data['Ex-Showroom_Price']])


    

df=pd.read_csv('cars_engage_2022.csv')
cols=['Make','Model','City_Mileage','Highway_Mileage','ARAI_Certified_Mileage','Type','Fuel_Type','Body_Type']
d=Vizualizer(df,cols)
df["Ex-Showroom_Price"] = df["Ex-Showroom_Price"].str.replace(r'.* ([\d,]+)+$', r'\1',regex=True).str.replace(',', '',regex=True).astype('int32')
d.box_plot()

错误

Traceback (most recent call last):
  File "c:\Users\shweta\OneDrive\Desktop\DEMO\demo\src\carsengage2022\preprocessing\roughVIZ.py", line 36, in <module>
    d.box_plot()
  File "c:\Users\shweta\OneDrive\Desktop\DEMO\demo\src\carsengage2022\preprocessing\roughVIZ.py", line 25, in box_plot
    sns.boxplot(x=col,y='Ex-Showroom_Price',data=self.data[self.data['Ex-Showroom_Price']])
  File "C:\Users\shweta\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\frame.py", line 3511, in __getitem__
    indexer = self.columns._get_indexer_strict(key, "columns")[1]
  File "C:\Users\shweta\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\indexes\base.py", line 5782, in _get_indexer_strict
    self._raise_if_missing(keyarr, indexer, axis_name)
  File "C:\Users\shweta\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\core\indexes\base.py", line 5842, in _raise_if_missing
    raise KeyError(f"None of [{key}] are in the [{axis_name}]")
KeyError: "None of [Int64Index([ 292667,  236447,  296661,  334768,  272223,  314815,  279650,\n             351832,  333419,  362000,\n            ...\n    
        1065900, 1182000, 1312000, 1111000, 1191000, 1302000, 1421000,\n            1431000, 1201000, 6862560],\n           dtype='int64', length=1276)] are 
in the [columns]"

我试图在列和它们的前陈列室价格之间画一个箱线图。前展厅价格的值是分类的,因此,我首先将它们转换为整数,然后尝试绘制箱线图,但它会抛出错误,关键错误:“None of [Int64Index...] dtype='int64]在列中。

共有1个答案

闻人和泽
2023-03-14

我认为你需要在这些线路上交换

df["Ex-Showroom_Price"] = df["Ex-Showroom_Price"].str.replace(r'.* ([\d,]+)+$', r'\1',regex=True).str.replace(',', '',regex=True).astype('int32')
d=Vizualizer(df,cols)

或者,请确保通过以下方式编辑类中的数据帧:

d=Vizualizer(df,cols)
d.df["Ex-Showroom_Price"] = df["Ex-Showroom_Price"].str.replace(r'.* ([\d,]+)+$', r'\1',regex=True).str.replace(',', '',regex=True).astype('int32')
 类似资料:
  • 这是我的数据帧: 我试着用它做一个非常简单的情节: 但我一直收到一条关键错误消息: 我尝试将列[a]转换为日期时间,但仍然收到相同的错误消息。

  • 我试图在管道上运行k-折叠交叉验证(标准化定标器,决策树分类器)。 首先,我导入数据。 然后对数据帧进行预处理 然后对特征和目标进行切片 并使用SMOTE来平衡数据 这是问题的一部分。 错误代码

  • 我试图使用np.random.shuffle()方法对索引进行洗牌,但我一直收到一个我不理解的错误。如果有人能帮我解决这个问题,我将不胜感激。非常感谢。 当我在开始创建我的raw_csv_数据变量时,我尝试使用分隔符='、'和delim_空格=0,因为我认为这是另一个问题的解决方案,但它不断抛出相同的错误 这是我尝试洗牌索引时不断遇到的错误: getitem(self,key)中的~\Anacon

  • 将测试和列车数据输入ROC曲线图时,我收到以下错误: KeyError:“[Int64Index([0,1,2,…dtype='int64',length=1323])中没有一个在[columns]中” 错误似乎是说它不喜欢我的数据格式,但它在第一次运行时起作用,我无法让它再次运行。 我是否错误地拆分数据或将格式错误的数据发送到函数中? 阅读几个StackOverflow帖子与相同的KeyErro

  • 下面是一个小版本的代码,其中我得到了这个错误: KeyError:"[Int64Index([...],dtype='int64')]都不在[列]" '...' 是一系列似乎与我的X和y数据帧的索引匹配的数字。 我使用Mlens包在一个非常大的数据集上与SuperLearner一起建模(因此可伸缩性非常重要)。我的目标是使用数据帧结构,而不是Numpy数组。这将解决下游问题。 到目前为止,我已经探

  • 有一个323列和10348行的数据帧。我想用下面的代码用分层k-Fold来划分它 但是我得到了以下错误 有人告诉我为什么会出现这个错误以及如何修复它吗