当前位置: 首页 > 知识库问答 >
问题:

按日和小时获取数据的总和

许嘉珍
2023-03-14

下面是我所拥有的数据的一个例子。

     date       time    size    filename            day.of.week
1   2015-01-16  5:36:12 1577    01162015053400.xml  Friday
2   2015-01-16  5:38:09 2900    01162015053600.xml  Friday
3   2015-01-16  5:40:09 3130    01162015053800.xml  Friday

我想做的是总结每小时文件的大小。

date        hour   size
2015-01-16  5      7607
2015-01-16  6      10000

共有1个答案

景建业
2023-03-14

假设您的示例数据存储在一个名为“test”的数据帧中,下面的操作应该可以完成:

library(lubridate) # for hms and hour functions
test$time <- hms(test$time) 
test$hour <- factor(hour(test$time))
library(dplyr)
test %>%
   select(-time) %>% # dplyr doesn't like this column for some reason
   group_by(date, hour) %>%
   summarise(size=sum(size))
 类似资料:
  • 问题内容: 如何获得熊猫timedelta中的总小时数? 例如: 注意:根据文档,该属性将返回小时 部分 : 问题答案: 只需找出适合1小时的时间:

  • 我有一个熊猫DataFrame看起来像这样: 我的目标是能够为每个项目计算每个日期之间的价值差异。例如,我想找到A项: 12(32-20,因为最大年份是2012年,最小年份是2010年)和B项:20 (40 - 20,因为最大年份是2019年,最小年份是2016年)。 我使用以下代码获取每个项目的年最大值和年最小值: 然后,我找到每个项目的年份最小值和年份最大值。然而,我坚持做我想要的。

  • 问题内容: 我有一个称为 activity_dt 的日期时间,数据如下所示: 如何按日期和小时分组? 问题答案: SQL Server: 甲骨文: MySQL的:

  • 问题内容: 我在获取24小时制的当前时间时遇到问题。据我所知,“ HH”应代表24小时制的当前小时,但是由于某种原因,“ HH”根本没有被解释。这就是为什么以下代码行输出类似 “ HH:50:06 Uhr,Sep. Sep.”的原因。 : 有什么想法我做错了吗?但是,使用“ hh”有效,这将以12小时制输出时间,这不是我想要的。 帮助表示赞赏! 问题答案: 您可以使用SimpleDateForma

  • 问题内容: 我正在使用SQLite,并尝试返回该列中某一列的总数,同时返回所有数据。我不想/不需要对数据进行分组,因为我需要在每个返回的行中都包含数据。 当我包含类似内容时, 它仅返回一行。我需要所有返回的行以及所有条目的总数。 问题答案: 听起来这就是您要寻找的内容: 参见带有演示的SQL Fiddle

  • 问题内容: 我有一个具有以下结构和示例数据的表: 我需要获取每个STORE_ID的每小时总计TOTAL_AMOUNT。我尝试了以下查询,但我不知道它是否正确。 问题答案: