当前位置: 首页 > 编程笔记 >

对python打乱数据集中X,y标签对的方法详解

许法
2023-03-14
本文向大家介绍对python打乱数据集中X,y标签对的方法详解,包括了对python打乱数据集中X,y标签对的方法详解的使用技巧和注意事项,需要的朋友参考一下

今天踩过的两个小坑:

一.用random的shuffle打乱数据集中的数据-标签对

index=[i for i in range(len(X_batch))]
# print(type(index))
index=random.shuffle(index)

结果shuffle完以后index变成None了,看了下api,这样说明的:

这个函数如果返回值,就返回None,所以用index=balabala就把index的内容改变了。去掉index=random.shuffle(index)等号前面的值,这样利用shuffle函数就可以直接将index的内容打乱,并且不返回任何值。

因此以上方式就可以打乱index的顺序,并以新顺序输出batch中的数据。

二.整体引用index这个list中的数据

因为index是一个list,所以代码这样写:

X_batch=X_batch[index]

Y_batch=Y_batch[index]

是有问题的,报错是:TypeError: list indices must be integers or slices, not list.

这是因为我的X_batch,Y_batch都是list,直接引用index是错误的。而可以直接引用的方法是如果X_batch,Y_batch是数组,index是数组,就可以。

所以代码改成了:

X_batch,Y_batch=data_generator(data_path)
index=[i for i in range(len(X_batch))]
# print(type(index))
random.shuffle(index)
index=np.array(index)

X_batch=[np.array(X_batch)[index]]
Y_batch=[np.array(Y_batch)[index]]

参考代码:

以上这篇对python打乱数据集中X,y标签对的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持小牛知识库。

 类似资料:
  • 本文向大家介绍python 随机打乱 图片和对应的标签方法,包括了python 随机打乱 图片和对应的标签方法的使用技巧和注意事项,需要的朋友参考一下 如下所示: 以上这篇python 随机打乱 图片和对应的标签方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持呐喊教程。

  • 本文向大家介绍对python函数签名的方法详解,包括了对python函数签名的方法详解的使用技巧和注意事项,需要的朋友参考一下 函数签名对象,表示调用函数的方式,即定义了函数的输入和输出。 在Python中,可以使用标准库inspect的一些方法或类,来操作或创建函数签名。 获取函数签名及参数 使用标准库的signature方法,获取函数签名对象;通过函数签名的parameters属性,获取函数参

  • 假设我有以下代码,它使用pandas绘制了一些非常简单的东西: 如何轻松设置x和y标签,同时保留使用特定颜色贴图的能力?我注意到pandas DataFrames的包装器没有任何特定的参数。

  • 问题内容: 我正在尝试创建数据列的直方图并以对数方式绘制(),但不确定以下代码为什么不起作用: 我也试过,而不是添加的行以及我试过,但似乎没有任何工作。我要么得到一个空图,要么确实是对数的(使用上面显示的代码),但是没有绘制任何数据(没有bin)。 问题答案: 尝试 http://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.yscale

  • 问题内容: 使用math.pow或**运算符哪个更有效?我什么时候应该使用另一个? 到目前为止,我知道可以返回一个或一个,如果您使用小数,该函数将返回一个浮点数 问题答案: 使用Power运算符将更快,因为它不会产生函数调用的开销。如果您反汇编Python代码,则可以看到以下内容: 请注意,我在这里使用变量作为指数,因为类似常数的表达式实际上是在编译时求值的。 现在,实际上,这种差异并不重要,正如

  • 问题内容: 嗨,我正在尝试从网站上抓取用户数据。我需要标签名称本身中可用的用户ID。我正在尝试在 div 标签中使用pythonselenium和漂亮的汤刮UID 。 例: 我试图在div标签中使用pythonselenium和漂亮的汤刮UID。我浏览了所有文档和几个网页,但找不到解决方案。如果有人能告诉我这种事情是否可能,我将非常感激。 问题答案: 假设属性值始终采用格式,后跟一个或多个字母数字