当前位置: 首页 > 知识库问答 >
问题:

简单数据帧读取_csv,然后使用Count/KeyError分组

袁奇逸
2023-03-14

我只是想得到给定列中某个值的行数,例如:

CSV数据:

'Occupation','data'
'Carpenter','data1'
'Carpenter','data2'
'Carpenter','data3'
'Painter','data1'
'Painter','data2'
'Programmer','data1'
'Programmer','data2'
'Programmer','data3'
'Programmer','data4'

程序:

filename = "./data/TestGroup.csv"

df = pd.read_csv(filename)
print(df.head())

print("Computing stats by HandRank... ")
df_stats = df[['data']].groupby(['Occupation']).agg(['count'])
# also tried:  df_stats = df[['Occupation']].groupby(['Occupation']).agg(['count'])
print(df_stats.head())

如何获取变量中的计数?做groupby和。agg是否返回另一个数据帧?

输出/错误:

  'Occupation'   'data'
0  'Carpenter'  'data1'
1  'Carpenter'  'data2'
2  'Carpenter'  'data3'
3    'Painter'  'data1'
4    'Painter'  'data2'
    Computing stats by HandRank... 
    Traceback (most recent call last):
      File "C:\Apps\PokerHandGenerator_Copy_not_Source\Server\TestPandasGroupBy.py", line 17, in <module>
        df_stats = df.groupby(['Occupation']).agg(['count'])
      File "C:\Apps\ProcessData\venv\lib\site-packages\pandas\core\frame.py", line 6714, in groupby
        return DataFrameGroupBy(
      File "C:\Apps\ProcessData\venv\lib\site-packages\pandas\core\groupby\groupby.py", line 560, in __init__
        grouper, exclusions, obj = get_grouper(
      File "C:\Apps\ProcessData\venv\lib\site-packages\pandas\core\groupby\grouper.py", line 811, in get_grouper
        raise KeyError(gpr)
    KeyError: 'Occupation'

df。head()显示它正在使用“职业”作为我的列名。

共有1个答案

尚安平
2023-03-14

熊猫认为第一栏是“职业”而不是“职业”。

使用这个:-

df_stats = df.groupby("'Occupation'").agg(['count'])

而不是使用这个:-

df_stats = df[['data']].groupby(['Occupation']).agg(['count'])
 类似资料:
  • 有人能解释为什么“路易斯维尔”会返回一个键错误吗?据我所知,这是在数据框架内。我错过了什么? 下面是数据的样子。这是一个CSV。 这就是关闭数据的内容。head()看起来像 off_data.index代码 Rajith Thennakoon的建议 输入 KeyError Traceback(最近的调用最后)~\Anaconda3\lib\site-包\熊猫\核心\索引\base.py在get_l

  • 我正在使用: Python 3.6.8 火花2.4.4 我在spark类路径中有以下JAR: http://repo1.maven.org/maven2/com/databricks/spark-redshift_2.11/2.0.1/spark-redshift_2.11-2.0.1.jar http://repo1.maven.org/maven2/com/databricks/spark-a

  • 本文向大家介绍python中count函数简单用法,包括了python中count函数简单用法的使用技巧和注意事项,需要的朋友参考一下 python中count函数的用法 Python count()方法 描述 Python count() 方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。 count()方法语法: 参数 sub -- 搜索的子字符串 start -

  • 我正在尝试创建一个dataframe,它可以显示和更新dataframe上的数据。我找到这个方法来创建一个循环并输出数据,它看起来是这样的: 我想创建一个dataframe来存储输出,并使用循环函数来更新行中的数据,请问有没有解决方案来解决它?

  • 我想从RSS提要中读出一个带有简单XML的特定属性。 项目示例: 我想阅读媒体中的网址:内容。 读取我使用的其他标记:$xml- 读取我尝试的媒体url属性:$xml- 但这只是返回NULL。它与内容有关,内容是一个名称空间。

  • 本文向大家介绍如何使用JSP读取表单数据?,包括了如何使用JSP读取表单数据?的使用技巧和注意事项,需要的朋友参考一下 JSP使用getParameter()方法读取简单参数,并使用getInputStream()方法读取来自客户端的二进制数据流来处理请求。 使用JSP读取表单数据 JSP根据情况使用以下方法自动处理表单数据解析- getParameter():您调用request.getPara