我只是想得到给定列中某个值的行数,例如:
CSV数据:
'Occupation','data'
'Carpenter','data1'
'Carpenter','data2'
'Carpenter','data3'
'Painter','data1'
'Painter','data2'
'Programmer','data1'
'Programmer','data2'
'Programmer','data3'
'Programmer','data4'
程序:
filename = "./data/TestGroup.csv"
df = pd.read_csv(filename)
print(df.head())
print("Computing stats by HandRank... ")
df_stats = df[['data']].groupby(['Occupation']).agg(['count'])
# also tried: df_stats = df[['Occupation']].groupby(['Occupation']).agg(['count'])
print(df_stats.head())
如何获取变量中的计数?做groupby和。agg是否返回另一个数据帧?
输出/错误:
'Occupation' 'data'
0 'Carpenter' 'data1'
1 'Carpenter' 'data2'
2 'Carpenter' 'data3'
3 'Painter' 'data1'
4 'Painter' 'data2'
Computing stats by HandRank...
Traceback (most recent call last):
File "C:\Apps\PokerHandGenerator_Copy_not_Source\Server\TestPandasGroupBy.py", line 17, in <module>
df_stats = df.groupby(['Occupation']).agg(['count'])
File "C:\Apps\ProcessData\venv\lib\site-packages\pandas\core\frame.py", line 6714, in groupby
return DataFrameGroupBy(
File "C:\Apps\ProcessData\venv\lib\site-packages\pandas\core\groupby\groupby.py", line 560, in __init__
grouper, exclusions, obj = get_grouper(
File "C:\Apps\ProcessData\venv\lib\site-packages\pandas\core\groupby\grouper.py", line 811, in get_grouper
raise KeyError(gpr)
KeyError: 'Occupation'
df。head()显示它正在使用“职业”作为我的列名。
熊猫认为第一栏是“职业”而不是“职业”。
使用这个:-
df_stats = df.groupby("'Occupation'").agg(['count'])
而不是使用这个:-
df_stats = df[['data']].groupby(['Occupation']).agg(['count'])
有人能解释为什么“路易斯维尔”会返回一个键错误吗?据我所知,这是在数据框架内。我错过了什么? 下面是数据的样子。这是一个CSV。 这就是关闭数据的内容。head()看起来像 off_data.index代码 Rajith Thennakoon的建议 输入 KeyError Traceback(最近的调用最后)~\Anaconda3\lib\site-包\熊猫\核心\索引\base.py在get_l
我正在使用: Python 3.6.8 火花2.4.4 我在spark类路径中有以下JAR: http://repo1.maven.org/maven2/com/databricks/spark-redshift_2.11/2.0.1/spark-redshift_2.11-2.0.1.jar http://repo1.maven.org/maven2/com/databricks/spark-a
本文向大家介绍python中count函数简单用法,包括了python中count函数简单用法的使用技巧和注意事项,需要的朋友参考一下 python中count函数的用法 Python count()方法 描述 Python count() 方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。 count()方法语法: 参数 sub -- 搜索的子字符串 start -
我正在尝试创建一个dataframe,它可以显示和更新dataframe上的数据。我找到这个方法来创建一个循环并输出数据,它看起来是这样的: 我想创建一个dataframe来存储输出,并使用循环函数来更新行中的数据,请问有没有解决方案来解决它?
我想从RSS提要中读出一个带有简单XML的特定属性。 项目示例: 我想阅读媒体中的网址:内容。 读取我使用的其他标记:$xml- 读取我尝试的媒体url属性:$xml- 但这只是返回NULL。它与内容有关,内容是一个名称空间。
本文向大家介绍如何使用JSP读取表单数据?,包括了如何使用JSP读取表单数据?的使用技巧和注意事项,需要的朋友参考一下 JSP使用getParameter()方法读取简单参数,并使用getInputStream()方法读取来自客户端的二进制数据流来处理请求。 使用JSP读取表单数据 JSP根据情况使用以下方法自动处理表单数据解析- getParameter():您调用request.getPara