当前位置: 首页 > 面试题库 >

从数据框中提取特定列

缪升
2023-03-14
问题内容

我有一个包含6列的R数据框,并且我想创建一个仅包含三列的新数据框。

假设我的数据帧df,我想提列A,B和E,这是唯一的命令,我可以计算出:

 data.frame(df$A,df$B,df$E)

有没有更紧凑的方法可以做到这一点?


问题答案:

如果您的data.frame被调用,则使用dplyr包df1:

library(dplyr)

df1 %>%
  select(A, B, E)

也可以在不使用%>%管道的情况下将其写为:

select(df1, A, B, E)


 类似资料:
  • 我有netcdf数据,其中包含2020年的每日数据,以特定湿度为变量,以及一个excel文件,其中包含北印度洋上空形成的所有气旋的日期。大多数情况下,当我们想要提取特定时间范围内的数据时,我们习惯使用 xarray 进行切片,但在这种特定情况下,我面临的问题是我只需要提取 excel 文件中那些特定旋风日的数据并创建一个复合。如果有人可以通过展示如何做到这一点来帮助我,我们将不胜感激。我正在附加一

  • 我必须根据特定条件过滤数据帧。如果解决方案考虑使用dplyr,效果更好。 我有这样的数据帧结构 如果列标签包含特定值(例如,3.),不仅要收集该行,还要收集与前一行具有相同sentID和partner值的所有行。 预期结果如下:

  • 对于熊猫数据帧的特定列,该列实际上是转换成BCD的16位数据。我只想提取特定行的14-8位并转换为BCD。下面的公式适用于如下的小数据帧。 但当我申请时 对于688126行的较大数据帧,我得到一个错误,说 基数为2的int()的文本无效:“” 错误如下所示 ValueError Traceback(最近调用最后一次)在1 df.LO_TIME_0_J2_0---- C:\ProgramData\A

  • 我有一个JSON如下 有没有什么方法可以直接将“ID”的值提取到变量中,而不需要遍历根元素,即“Root1”。因为每次运行应用程序时根元素名称都会发生变化,比如“Root2”、“Root3”。 下面是我尝试使用“Root1”和“Result”元素提取ID的代码

  • 我不知道如何选择特定的JSON数据。 如何更改此代码以使我只有id,而没有其他响应数据? 我在网上阅读,显然我需要使用结构?我不确定如何处理这个问题。 这将返回...

  • 我正在使用forkify API制作一个配方搜索应用程序。我得到了这样的json(以披萨食谱为例)。我已经做了一个回收和搜索,但食谱本身是作为一个链接提供给该网站的配方(见json中的source_url)。我已经为此制作了一个网络视图,但有一个问题。我需要得到那个源url,并让它与我点击的菜谱匹配。我试图在Rescycler中创建一个额外的元素,小的不可见文本视图,并将source_url放在那