我有一个数据框,其中一列叫做“逐步更新日期”,它包含对象,看起来像:
|Step-up date
0|Mar-24
1|Jul-22
2|Feb-21
etc...
3月24日表示2024年3月,所以我想知道是否有办法将该列转换为日期,所以3月24日将是2024-03-01(yyyy-mm-dd),只是让它自动成为每月的第1个值它更容易
先在年前加20,然后用pd.to_datetime:
df['Step-up date'] = df['Step-up date'].apply(lambda x:
pd.to_datetime(x.replace('-', '-20')))
由于未指定日期,pandas始终添加day=1
,为了正确解析,请使用%b-%y
将中月份名称的前3个字母和年份的最后2个数字格式化为\u datetime
:
df['Step-up date'] = pd.to_datetime(df['Step-up date'], format='%b-%y')
print (df)
Step-up date
0 2024-03-01
1 2022-07-01
2 2021-02-01
我有一个熊猫列,其中包含时间数据和列数据类型是对象。 如何将列转换为Datatime
我正在尝试将RDD[String]转换为数据框。字符串是逗号分隔的,所以我希望逗号之间的每个值都有一列。为此,我尝试了以下步骤: 但我明白了: 这不是这篇文章的副本(如何将rdd对象转换为火花中的数据帧),因为我要求RDD[字符串]而不是RDD[行]。 而且它也不是火花加载CSV文件作为DataFrame的副本?因为这个问题不是关于将CSV文件读取为DataFrame。
有人知道如何将dataframe中的所有列值转换为int吗? 假设我有一个包含 dtypes是对象,如何将其转换为int或numeric
问题内容: 我试图将字符串转换为日期时间对象。我从新闻提要中获取的字符串格式如下:“星期四,2014年10月16日美国东部时间01:16:17” 我尝试使用datetime.strptime()进行转换。即 并得到以下错误: 追溯(最近一次通话最近): 文件“”,第1行,位于datetime.strptime(’Thu,16 Oct 2014 01:16:17 EDT’,’%a,%d%b%Y%H:
我有一个pandas数据框架,其中混合了数据类型(DType),我希望将其转换为numpy结构化数组(或记录数组,在本例中基本相同)。对于纯数字数据帧,使用方法很容易做到这一点。我还需要将pandas列的数据类型转换为字符串而不是对象,以便使用numpy方法,该方法将数字和字符串输出到二进制文件,但不会输出对象。 简而言之,我需要将带有的panda列转换为字符串或unicode数据类型的numpy
问题内容: 考虑一个输入文件: 我可以将每月总计进行分组,如下所示: 分组总数的索引如下: 我想将索引重新格式化为日期时间格式(天可以是一个月的第一天)。 我尝试了以下方法: 和 都失败了。有人知道我该怎么做吗? 问题答案: 考虑按“ M”进行重采样,而不是按DatetimeIndex的属性分组: 注意:如果您不想在这两个月之间,则必须删除NaN。