我一直在学习Python线性回归教程:https://medium.com/@contactsunny/linear-regression-in-python-using-scikit-learn-f0f7b125a204
使用以下数据集:https://github.com/contactsunny/data-science-examples/blob/master/salaryData.csv
我的问题在于以下代码:
x = dataset.iloc[:, :-1].values
否定(-1)在这里做什么?如果我使用以下选项作为替代选项,为什么会出现错误:
x = dataset.iloc[:, 0].values
意思是,获取除最后一列以外的所有列:
df = pd.DataFrame(np.random.randint(0,100,(5,5)), index=[*'abcde'], columns=[*'ABCDE'])
df.iloc[:,:-1]
输出:
A B C D
a 79 23 9 89
b 67 60 32 82
c 66 18 41 67
d 90 51 63 29
e 34 65 82 82
此语句获取所有行并对列进行切片以过滤掉最后一行。而且,你的第二个陈述没有错误,这是一个好的陈述。
df.iloc[:, 0]
输出:
a 79
b 67
c 66
d 90
e 34
Name: A, dtype: int3
获取第一列的所有行(位置0)。
本文向大家介绍python选取特定列 pandas iloc,loc,icol的使用详解(列切片及行切片),包括了python选取特定列 pandas iloc,loc,icol的使用详解(列切片及行切片)的使用技巧和注意事项,需要的朋友参考一下 df是一个dataframe,列名为A B C D 具体值如下: A B C D 0 ss 小红 8 1 aa 小明 d 4 f f 6 ak 小紫 7
问题内容: 我正在处理从H5文件加载的调查数据,就像通过熊猫包一样。在此范围内,所有行都是单个调查的结果,而列则是单个调查中所有问题的答案。 我的目标是将数据集减少到较小的范围,仅包括对某个问题具有特定答案的行,即该列中的所有值均相同。我可以在这种情况下确定所有行的索引值,但是我找不到如何 删除 这些行或仅使用这些行创建新df的方法。 问题答案:
我有一个熊猫数据框,有许多标记列。例如: 我想用多个范围切片这个数据帧。例如: 但这似乎是不可能的。有没有办法做到这一点? 这个问题与使用Pandas和Pandas Dataframe选择多个不连续列/切片切片多列范围有关,但我希望使用列名而不是索引切片<代码>np。r 似乎不支持字符串范围,只支持数字范围。
我有这个数组 因为我只想渲染前5张照片。。如何从阵列中获取前5张照片??
问题内容: 我正在寻找一种有效的方法来检查切片是否是另一个切片的子集。我可以简单地遍历它们进行检查,但是我觉得必须有更好的方法。 例如 {1,2,3}是{1,2,3,4} 的子集{1,2,2}不是{1,2,3,4}的子集 有效执行此操作的最佳方法是什么? 谢谢! 问题答案: 我认为解决子集问题的最常见方法是通过地图。 检查重复值的能力相对罕见。上面的代码按要求解决了问题(请参阅:http : //
问题内容: 我有一个数据框。 我想选择在所有指数是 不是 在列表中, 现在,我使用列表理解来创建所需的标签以进行切片。 工作正常,但如果我经常需要这样做可能会很笨拙。 有一个更好的方法吗? 问题答案: 在索引上使用并反转布尔索引以执行标签选择: