当前位置: 首页 > 知识库问答 >
问题:

“特征提取”是机器学习的核心任务吗?

微生良策
2023-03-14

我一直在和一个朋友争论“特征提取”。他说,ML的主要任务是提取特征。但我不同意。一般来说,特征提取不是一项ML任务。如果我们认为wx b是表示ML的最简单的方法,那么ML的任务就是找到最好的w和b。x是特征。ML试图找出给定x的最佳w和b值,它与训练数据匹配,从而学习如何找到w和b。

我的朋友说提取特征是ML的核心任务。但据我所知,特征提取主要是一项数据预处理任务。

共有1个答案

鲍健柏
2023-03-14

提取特征是机器学习中的一项重要工作。没有特征,你就找不到最好的“w”和“b”。如果你能够在没有特征提取的情况下找到w和b,那么你就不需要继续使用机器学习了。

 类似资料:
  • 在机器学习中,灰度图像的特征提取是一个难题。 我有一个灰色的图像,是用这个从彩色图像转换而来的。 我实际上需要从这张灰色图片中提取特征,因为下一部分将训练一个具有该特征的模型,以预测图像的彩色形式。 我们不能使用任何深度学习库 有一些方法,如快速筛选球。。。但我真的不知道如何才能为我的目标提取特征。 以上代码的输出就是真的。 有什么解决方案或想法吗?我该怎么办?

  • 主成分分析是一种降维方法,通过将一个大的特征集转换成一个较小的特征集,这个特征集仍然包含了原始数据中的大部分信息,从而降低了原始数据的维数。换句话说就是减少数据集的特征数量,同时尽可能地保留信息。降维是将训练数据中的样本(实例)从高维空间转换到低维空间,该过程与信息论中有损压缩概念密切相关。同时要明白的,不存在完全无损的降维。

  • 我一直在努力创建一个Python模块,该模块执行特征提取,最终被机器学习算法使用。 我的方法是用(手工制作的)特征来增强最初的黄金标准数据集,从而创建一个新的数据集,这样训练就不涉及任何特征创建,这可能很昂贵。我相信这是大多数数据集的规范——总是包含核心特征(例如词性标签、命名实体标签、语义标签等)。 我使用的数据集只包括所有标记的句子,格式为XML标记。例如: 我想为每个标记添加其他信息,例如词

  • 假设我有两组不同的特性A和B。我正在尝试确定哪一组特性是最好的。由于我的数据集很小,所以我使用了漏掉一个交叉验证作为最终指标。我正试图弄清楚我的实验装置,我在以下几种方式中做出选择: 1) 将特征集A赋予我的分类器(并可选地运行特征选择),将特征集B赋予同一分类器(也可选地运行特征选择),然后比较这两个分类器之间的LOOCV错误? 2) 将特征集A和B赋予分类器,然后明确地对其进行特征选择,然后根

  • 说明 该文档为“3Blue1Brown - 深度学习系列视频”的整理,主要包括三个视频 神经网络的结构 梯度下降法 反向传播算法 让我们跟着 3Blue1Brown 从偏数学的角度来理解神经网络(原视频假设观众对神经网络没有任何背景知识) 目录 内容: 神经网络是什么? 神经网络的结构 神经网络的工作机制 深度学习中的“学习”指的是什么? 神经网络的不足 示例:一个用于数字手写识别的神经网络 这个

  • Spark特征提取(Extracting)的3种算法(TF-IDF、Word2Vec以及CountVectorizer)结合Demo进行一下理解 TF-IDF算法介绍: 词频-逆向文件频率(TF-IDF)是一种在文本挖掘中广泛使用的特征向量化方法,它可以体现一个文档中词语在语料库中的重要程度。 词语由t表示,文档由d表示,语料库由D表示。词频TF(t,,d)是词语t在文档d中出现的次数。文件频率D