当前位置: 首页 > 知识库问答 >
问题:

在Pandas中使用iloc和负整数进行切片[重复]

戚育
2023-03-14

我一直在学习Python线性回归教程:https://medium.com/@contactsunny/linear-regression-in-python-using-scikit-learn-f0f7b125a204

使用以下数据集:https://github.com/contactsunny/data-science-examples/blob/master/salaryData.csv

我的问题在于以下代码:

x = dataset.iloc[:, :-1].values

否定(-1)在这里做什么?如果我使用以下选项作为替代选项,为什么会出现错误:

x = dataset.iloc[:, 0].values

共有1个答案

吴单鹗
2023-03-14

意思是,获取除最后一列以外的所有列:

df = pd.DataFrame(np.random.randint(0,100,(5,5)), index=[*'abcde'], columns=[*'ABCDE'])

df.iloc[:,:-1]

输出:

    A   B   C   D
a  79  23   9  89
b  67  60  32  82
c  66  18  41  67
d  90  51  63  29
e  34  65  82  82

此语句获取所有行并对列进行切片以过滤掉最后一行。而且,你的第二个陈述没有错误,这是一个好的陈述。

df.iloc[:, 0]

输出:

a    79
b    67
c    66
d    90
e    34
Name: A, dtype: int3

获取第一列的所有行(位置0)。

 类似资料:
  • 本文向大家介绍python选取特定列 pandas iloc,loc,icol的使用详解(列切片及行切片),包括了python选取特定列 pandas iloc,loc,icol的使用详解(列切片及行切片)的使用技巧和注意事项,需要的朋友参考一下 df是一个dataframe,列名为A B C D 具体值如下: A B C D 0 ss 小红 8 1 aa 小明 d 4 f f 6 ak 小紫 7

  • 问题内容: 我正在处理从H5文件加载的调查数据,就像通过熊猫包一样。在此范围内,所有行都是单个调查的结果,而列则是单个调查中所有问题的答案。 我的目标是将数据集减少到较小的范围,仅包括对某个问题具有特定答案的行,即该列中的所有值均相同。我可以在这种情况下确定所有行的索引值,但是我找不到如何 删除 这些行或仅使用这些行创建新df的方法。 问题答案:

  • 我有一个熊猫数据框,有许多标记列。例如: 我想用多个范围切片这个数据帧。例如: 但这似乎是不可能的。有没有办法做到这一点? 这个问题与使用Pandas和Pandas Dataframe选择多个不连续列/切片切片多列范围有关,但我希望使用列名而不是索引切片<代码>np。r 似乎不支持字符串范围,只支持数字范围。

  • 我有这个数组 因为我只想渲染前5张照片。。如何从阵列中获取前5张照片??

  • 问题内容: 我正在寻找一种有效的方法来检查切片是否是另一个切片的子集。我可以简单地遍历它们进行检查,但是我觉得必须有更好的方法。 例如 {1,2,3}是{1,2,3,4} 的子集{1,2,2}不是{1,2,3,4}的子集 有效执行此操作的最佳方法是什么? 谢谢! 问题答案: 我认为解决子集问题的最常见方法是通过地图。 检查重复值的能力相对罕见。上面的代码按要求解决了问题(请参阅:http : //

  • 问题内容: 我有一个数据框。 我想选择在所有指数是 不是 在列表中, 现在,我使用列表理解来创建所需的标签以进行切片。 工作正常,但如果我经常需要这样做可能会很笨拙。 有一个更好的方法吗? 问题答案: 在索引上使用并反转布尔索引以执行标签选择: