问题：

简单数据帧读取_csv，然后使用Count/KeyError分组

袁奇逸

2023-03-14

我只是想得到给定列中某个值的行数，例如：

CSV数据：

'Occupation','data'
'Carpenter','data1'
'Carpenter','data2'
'Carpenter','data3'
'Painter','data1'
'Painter','data2'
'Programmer','data1'
'Programmer','data2'
'Programmer','data3'
'Programmer','data4'

程序：

filename = "./data/TestGroup.csv"

df = pd.read_csv(filename)
print(df.head())

print("Computing stats by HandRank... ")
df_stats = df[['data']].groupby(['Occupation']).agg(['count'])
# also tried:  df_stats = df[['Occupation']].groupby(['Occupation']).agg(['count'])
print(df_stats.head())

如何获取变量中的计数？做groupby和。agg是否返回另一个数据帧？

输出/错误：

  'Occupation'   'data'
0  'Carpenter'  'data1'
1  'Carpenter'  'data2'
2  'Carpenter'  'data3'
3    'Painter'  'data1'
4    'Painter'  'data2'
    Computing stats by HandRank... 
    Traceback (most recent call last):
      File "C:\Apps\PokerHandGenerator_Copy_not_Source\Server\TestPandasGroupBy.py", line 17, in <module>
        df_stats = df.groupby(['Occupation']).agg(['count'])
      File "C:\Apps\ProcessData\venv\lib\site-packages\pandas\core\frame.py", line 6714, in groupby
        return DataFrameGroupBy(
      File "C:\Apps\ProcessData\venv\lib\site-packages\pandas\core\groupby\groupby.py", line 560, in __init__
        grouper, exclusions, obj = get_grouper(
      File "C:\Apps\ProcessData\venv\lib\site-packages\pandas\core\groupby\grouper.py", line 811, in get_grouper
        raise KeyError(gpr)
    KeyError: 'Occupation'

df。head（）显示它正在使用“职业”作为我的列名。

共有1个答案

尚安平

2023-03-14

熊猫认为第一栏是“职业”而不是“职业”。

使用这个：-

df_stats = df.groupby("'Occupation'").agg(['count'])

而不是使用这个：-

df_stats = df[['data']].groupby(['Occupation']).agg(['count'])

类似资料：

数据帧中的对象值的KeyError

有人能解释为什么“路易斯维尔”会返回一个键错误吗？据我所知，这是在数据框架内。我错过了什么？下面是数据的样子。这是一个CSV。这就是关闭数据的内容。head（）看起来像 off_data.index代码 Rajith Thennakoon的建议输入 KeyError Traceback（最近的调用最后）~\Anaconda3\lib\site-包\熊猫\核心\索引\base.py在get_l
从Redshift读取Spark数据帧返回空数据帧

我正在使用： Python 3.6.8 火花2.4.4 我在spark类路径中有以下JAR： http://repo1.maven.org/maven2/com/databricks/spark-redshift_2.11/2.0.1/spark-redshift_2.11-2.0.1.jar http://repo1.maven.org/maven2/com/databricks/spark-a
python中count函数简单用法

本文向大家介绍python中count函数简单用法，包括了python中count函数简单用法的使用技巧和注意事项，需要的朋友参考一下 python中count函数的用法 Python count()方法描述 Python count() 方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。 count()方法语法：参数 sub -- 搜索的子字符串 start -
Web刮取数据，然后在数据帧上显示和更新它

我正在尝试创建一个dataframe，它可以显示和更新dataframe上的数据。我找到这个方法来创建一个循环并输出数据，它看起来是这样的：我想创建一个dataframe来存储输出，并使用循环函数来更新行中的数据，请问有没有解决方案来解决它？
使用简单XML读取XML属性

我想从RSS提要中读出一个带有简单XML的特定属性。项目示例：我想阅读媒体中的网址：内容。读取我使用的其他标记：$xml- 读取我尝试的媒体url属性：$xml- 但这只是返回NULL。它与内容有关，内容是一个名称空间。
如何使用JSP读取表单数据？

本文向大家介绍如何使用JSP读取表单数据？，包括了如何使用JSP读取表单数据？的使用技巧和注意事项，需要的朋友参考一下 JSP使用getParameter()方法读取简单参数，并使用getInputStream()方法读取来自客户端的二进制数据流来处理请求。使用JSP读取表单数据 JSP根据情况使用以下方法自动处理表单数据解析- getParameter()：您调用request.getPara

简单数据帧读取_csv，然后使用Count/KeyError分组

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档