当前位置: 首页 > 面试题库 >

如何在数据框的数组列中选择元素?

孙佐
2023-03-14
问题内容

我有以下数据框:

pa=pd.DataFrame({'a':np.array([[1.,4.],[2.],[3.,4.,5.]])})

我想选择列“ a”,然后仅选择一个特定元素(即,首先:1.,2.,3)。

我需要添加什么:

pa.loc[:,['a']]


问题答案:

pa.loc[row]选择带有标签的行row

pa.loc[row, col]选择作为row和的instersection的单元格col

pa.loc[:, col]选择 所有
行和名为的列col。请注意,尽管这可行,但这并不是引用数据框的列的惯用方式。为此,您应该使用pa['a']

现在,您在列的单元格中有了列表,因此可以使用向量化的字符串方法来访问这些列表的元素,如下所示。

pa['a'].str[0] #first value in lists
pa['a'].str[-1] #last value in lists


 类似资料:
  • 本文向大家介绍如何仅从R数据框中选择数字列?,包括了如何仅从R数据框中选择数字列?的使用技巧和注意事项,需要的朋友参考一下 最简单的方法是使用dplyr包的select_if函数,但我们也可以通过lapply来实现。 使用dplyr 使用lapply

  • 问题内容: 我已经做了一些寻找该问题答案的搜索,但是我能弄清楚的是: 在我看来,这似乎很古怪,又不合蟒蛇风(而且很慢?)。 在不指定列名的情况下,为pandas数据框中的最后一列选择数据的最简单方法是什么? 问题答案: 使用iloc并针对最后一列()选择所有行():

  • 问题内容: 我在不同的列中有数据,但是我不知道如何提取数据以将其保存在另一个变量中。 如何选择然后将其保存到df1中? 我试过了 似乎没有任何工作。 问题答案: 列名(字符串)无法按照你尝试的方式进行切片。 在这里,你有两个选择。如果从上下文中知道要切出哪些变量,则可以通过将列表传递给语法来仅返回那些列的视图。 或者,如果需要对它们进行数字索引而不是按其名称进行索引(例如,你的代码应在不知道前两列

  • 问题内容: 我想为某个列(例如column)选择一个范围。我想选择-0.5到+0.5之间的所有值。如何做到这一点? 我希望使用 但这(自然)给出了ValueError: 我试过了 但这全部输出了。 正确的输出应该是 在pandas数据框列中查找值范围的正确方法是什么? 编辑:问题 使用与 将是之间的区别 和不平等之类的 ? 问题答案: 使用有严格的不平等: 该参数确定是否包括端点(:,:)。这适用

  • 通过添加活动类手动激活 这应该有用,但不行

  • 我试图提取数据帧中的第7到14列。然而 只给出第1到第3行。 有人知道如果我想找到这些专栏我该怎么做吗? 我知道如何使用列名,如,但由于名称太多,我只想在R中键入类似的内容。 提前感谢。