当前位置: 首页 > 知识库问答 >
问题:

在R中转换数据表格式:如何将日期转换为年份(每个ID每年新行)

夹谷晋
2023-03-14

我必须将数据帧从当前格式转换为新格式(见下图或结构)。我不知道我怎样才能做到这一点。我希望每个ID有一年,从2013年到2018年(因此每个ID有6行,每年一行)。日期是居住在该地址的日期(进入日期)和离开该地址的日期(结束日期)。因此,每个ID和年份都给出了他们居住的zipcode和城市。ID(每年)居住的地方应该是他们在那一年居住的时间最长的地方。我已经将截止日期设置为2018年12月31日,如果他们仍然住在那里(这里用NA显示)。下面是一张图片和前3行。希望你们能帮我!

当前格式:

  • ID(1,1,2)

新格式:

>

  • ID(1,1,1,1,1,1,1,2)
  • 年份(2013、2014、2015、2016、2017、2018、2013)
  • ZIPCODE(NA、1234AB、1234AB、1234AB、5678CD、5678CD、9012EF)
  • 城市(北美、纽约、纽约、纽约、洛杉矶、洛杉矶、迈阿密)

    见下面的链接

  • 共有1个答案

    柳豪
    2023-03-14

    这里有一种方法。

    首先,为每个位置创建从开始日期到结束日期的日期间隔。使用map2unest您将为每年创建额外的行。

    由于您希望包含该日历年天数最多的位置信息,因此可以查看两个间隔之间的重叠:一个间隔是日历年,第二个间隔是输入日期结束日期。对于每一年,您可以通过<代码> max(星期) <代码> >筛选器> />(或确保每年一个地址,按周降序排列,<代码>切片(1)< /代码>或用最新<代码> TiDyr < /代码>考虑<代码> SLICEXMAX )。这将保留间隔之间存在最大周数持续时间重叠的行。

    最终的complete将确保您在2013-2018年的所有年份都有行。

    library(tidyverse)
    library(lubridate)
    
    df %>%
      mutate(ENTRY_END_INT = interval(ENTRY_DATE, END_DATE),
             YEAR = map2(year(ENTRY_DATE), year(END_DATE), seq)) %>%
      unnest(YEAR) %>%
      mutate(YEAR_INT = interval(as.Date(paste0(YEAR, '-01-01')), as.Date(paste0(YEAR, '-12-31'))),
             WEEKS = as.duration(intersect(ENTRY_END_INT, YEAR_INT))) %>%
      group_by(ID, YEAR) %>%
      arrange(desc(WEEKS)) %>%
      slice(1) %>%
      group_by(ID) %>%
      complete(YEAR = seq(2013, 2018, 1)) %>%
      arrange(ID, YEAR) %>%
      select(-c(ENTRY_DATE, END_DATE, ENTRY_END_INT, YEAR_INT, WEEKS))
    

    输出

    # A tibble: 14 x 4
    # Groups:   ID [2]
          ID  YEAR ZIPCODE CITY   
       <dbl> <dbl> <chr>   <chr>  
     1     1  2013 NA      NA     
     2     1  2014 1234AB  NEWYORK
     3     1  2015 1234AB  NEWYORK
     4     1  2016 1234AB  NEWYORK
     5     1  2017 5678CD  LA     
     6     1  2018 5678CD  LA     
     7     2  2011 9012EF  MIAMI  
     8     2  2012 9012EF  MIAMI  
     9     2  2013 9012EF  MIAMI  
    10     2  2014 9012EF  MIAMI  
    11     2  2015 9012EF  MIAMI  
    12     2  2016 9012EF  MIAMI  
    13     2  2017 9012EF  MIAMI  
    14     2  2018 NA      NA    
    

    数据

    df <- structure(list(ID = c(1, 1, 2), ZIPCODE = c("1234AB", "5678CD", 
    "9012EF"), CITY = c("NEWYORK", "LA", "MIAMI"), ENTRY_DATE = structure(c(16072, 
    17238, 15288), class = "Date"), END_DATE = structure(c(17299, 
    17896, 17415), class = "Date")), class = "data.frame", row.names = c(NA, 
    -3L))
    
     类似资料:
    • 问题内容: 我正在使用模块,即: 我想计算考虑takes年的一年中的某天。例如今天(2009年3月6日)是2009年的第65天。 我看到两个选择: 创建一个数组,确定是否是a年,然后手动汇总天数。 用于猜测,然后二进制搜索一年中的正确日期: YEAR = 2009 DAY_OF_YEAR = 62 d = datetime.date(YEAR, 1, 1) + datetime.timedelta

    • 问题内容: 我表中的日期存储为十进制年份。一个示例翻译为。 我想将十进制年份转换为Oracle的日期格式。 我找到了在Excel中完成此操作的人:十进制的年初至今公式? 但是,我不太清楚如何将逻辑转换为Oracle PL / SQL。 问题答案: 如果您假设小数部分是根据给 定年份中的天数 (即365或366,取决于是否是leap年)来计算的,则可以执行以下操作:

    • 问题内容: 我正在尝试将字符串转换为日期 但在我看来,它有一个。的。这是为什么?我想生成一个日期 问题答案: 日期字符串- 符合- d-每月的某天 M-一年中的月份 y-年 …

    • ECMA-262 语言规范第 21.4.1.15.1 段详细介绍了扩展年份日期格式 引述: 21.4.1.15.1 扩展年份 涵盖1970年1月1日(21.4.1.1)前后约273,790年的全时值范围需要表示0之前或9999之后的年份。ISO 8601允许扩展年份表示。 在简化的ECMAScript格式中,这种扩展的年份表示应具有6位数字,并且始终以或符号作为前缀。0年被视为正,因此以符号作为前

    • 如果在程序中有人给我天数(ab=“days”),我需要将变量“days”设置为相同的数字(“val”中的值),如果有人给我月份(ab=“months”),那么我需要将其转换为天(val中的值),如果有人给我年(ab=“years”),那么我需要将其转换为天(val中的值)。ie如果用户在变量“ab”中指定了值的类型(即是月、年或日期)和变量“val”中的天数(天/月/年),我需要在变量“天”中获得

    • 当我没有发现任何关于将年龄转换为出生日期的内容时,我感到惊讶。关于将出生日期转换为年龄,有很多答案,但并非相反。 我有两位数(我能够将它们转换为任何数据类型,甚至转换为DateTime.date(python-格式))。如何将它们转换为完整的SQL日期。它必须current_date年龄(日期和月份对我来说不重要)。最好通过数据库而不是python来完成此操作。 DDL: p、 美国相关问题在My