我想计算每小时重复的行数。
我的数据帧:
hour index name
08:00:00 1442 x
08:45:00 3434 y
08:30:00 1442 x
08:00:00 1442 x
08:45:00 3434 y
08:00:00 1442 x
我的代码:我尝试按小时对数据进行分组并计数。转换没有帮助。
df_count= df.groupby('hour')[['index','name']].count()
这就是错误:
TypeError: only integer scalar arrays can be converted to a scalar index
这是我想要的输出:
hour index name count
08:00:00 1442 x 3
08:30:00 1442 x 1
08:45:00 3434 y 2
我不知道你的数据是怎么回事。当我这样设置一个时:
df = pd.DataFrame({
'hour': ['08:00:00', '08:45:00', '08:30:00', '08:00:00', '08:45:00', '08:00:00'],
'index': [1442, 3434, 1442, 1442, 3434, 1442],
'name': ['x', 'y', 'x', 'x', 'y', 'x'],
})
然后你的代码工作正常(它不做你想要的,但它运行没有问题):
>>> df.groupby('hour')[['index','name']].count()
index name
hour
08:00:00 3 3
08:30:00 1 1
08:45:00 2 2
在任何情况下,一旦修复了数据帧内容,以下内容都会得到预期的结果:
>>> df.groupby(['hour', 'index', 'name']).size()
hour index name
08:00:00 1442 x 3
08:30:00 1442 x 1
08:45:00 3434 y 2
您还可以添加:。到帧(“计数”)。如果愿意,请重置索引()。
我是相当新的python/Numpy和不完全意识到它。 我一直试图实现一个算法,并在某一点上卡住了,当试图把数组的点积与其转置。我得到的错误是 TypeError:只能将整数标量数组转换为标量索引。 下面是我的代码,供参考。
我看到的代码是: 不同变量的值是: ID: 欠条: 阈值:
下面是代码: 我得到以下错误: 回溯(最后一次调用):文件“/Users/evgenypavlov/Documents/ml_tutorial_1/main.py”,第34行,在x_train=np中。重塑(x_列,(x_列.shape[0],x_列[1],1])文件“ 据我所知,我已经把它转换成np了。数组,那么什么会导致此问题以及如何解决它?
尝试在包含279个文件的数据集上执行Kfold cv时,执行k-means后,文件的形状为。我对它进行了重塑,以使其适合svm。现在形状是。尝试Kfold cv方法会给我带来错误 msgstr"只有整数标量数组可以转换为标量索引"
我正在尝试一个来自github链接的tensorflow的简单演示代码 我目前正在使用python版本3.5。2 我在命令行中尝试board.py时遇到了这个错误。我已经安装了运行此操作所需的所有依赖项。
我使用np。随机的选择获取随机索引,但遇到以下错误。 TypeError:只能将整数标量数组转换为标量索引。任何建议都将不胜感激。