当前位置：首页 > 面试题库 >

给定一个1000列100万行的训练数据集，怎么进行降维？

籍永安

2023-03-14

本文向大家介绍给定一个1000列100万行的训练数据集，怎么进行降维？相关面试题，主要包含被问及给定一个1000列100万行的训练数据集，怎么进行降维？时的应答技巧和注意事项，需要的朋友参考一下

对大样本进行抽样使其变为小样本
可以将分类变量和数值变量分开，同时删掉相关联的变量，对于数值变量，可以通过相关性分析来找到相关的特征，对于分类变量可以通过卡方检验来找到
还可以通过PCA降维，获取包含最多方差的特征，也就是包含最多信息的特征

类似资料：

Keras不训练整个数据集

问题内容：因此，我一直遵循Google的官方tensorflow指南，并尝试使用Keras构建一个简单的神经网络。但是，在训练模型时，它不使用整个数据集（具有60000个条目），而是仅使用1875个条目进行训练。有可能解决吗？输出：这是我一直在为此工作的原始Google colab笔记本：https ://colab.research.google.com/drive/1NdtzXHEpiN
如何准备Illiad数据集以使用Python进行训练？

本文向大家介绍如何准备Illiad数据集以使用Python进行训练？，包括了如何准备Illiad数据集以使用Python进行训练？的使用技巧和注意事项，需要的朋友参考一下 Tensorflow是Google提供的一种机器学习框架。它是一个开放源代码框架，与Python结合使用以实现算法，深度学习应用程序等等。它用于研究和生产目的。可以使用下面的代码行在Windows上安装'tensorflow'
使用tensorflow_datasets.load（TF 2.1）拆分训练数据以进行训练和验证

问题内容：我正在尝试运行以下Colab项目，但是当我想将训练数据分为验证和训练部分时，出现此错误：我使用以下代码：如何解决此错误？问题答案：根据Tensorflow Dataset docs ，百分比拆分是可能的，例如如示例所示，更改列表时，您的代码将起作用：使用上面的代码，有2590个条目，而有1080个。
检测20类物体，多少张训练集，怎么训练

本文向大家介绍检测20类物体，多少张训练集，怎么训练相关面试题，主要包含被问及检测20类物体，多少张训练集，怎么训练时的应答技巧和注意事项，需要的朋友参考一下参考回答：多分类问题，保证各类别的样例比，提取特征，用libsvm等做多分类。
Tensorflow如何用于准备IMDB数据集以在Python中进行训练？

本文向大家介绍Tensorflow如何用于准备IMDB数据集以在Python中进行训练？，包括了Tensorflow如何用于准备IMDB数据集以在Python中进行训练？的使用技巧和注意事项，需要的朋友参考一下 Tensorflow是Google提供的一种机器学习框架。它是一个开放源代码框架，与Python结合使用以实现算法，深度学习应用程序等等。它用于研究和生产目的。它具有优化技术，可帮助快速执
批量加载一个巨大的数据集来训练pytorch

我正在训练一个LSTM，以便将时间序列数据分类为2类（0和1）。我在驱动器上有巨大的数据集，其中0类和1类数据位于不同的文件夹中。我试图通过创建一个Dataset类并将DataLoader包装在它周围来批量使用LSTM。我必须做整形等预处理。这是我的密码 ' `我在运行此代码时遇到此错误 RuntimeError:Traceback（最后一次调用）：文件“/usr/local/lib/python

给定一个1000列100万行的训练数据集，怎么进行降维？

相关阅读

相关文章

相关问答

相关工具

相关文档