当前位置: 首页 > 面试题库 >

简要说说一个完整机器学习项目的流程?

叶允晨
2023-03-14
本文向大家介绍简要说说一个完整机器学习项目的流程?相关面试题,主要包含被问及简要说说一个完整机器学习项目的流程?时的应答技巧和注意事项,需要的朋友参考一下
  1. 抽象成数学问题(确定是一个分类问题、回归问题还是聚类问题,明确可以获得什么样的数据)
  2. 获取数据(数据要具有代表性,对数据的量级也要有一个评估,多少样本,多少特征,对内存的消耗,考虑内存是否能放得下,如果放不下考虑降维或者改进算法,如果数据量太大,考虑分布式)
  3. 特征预处理和特征选择(数据清洗,归一化、缺失值处理、去除共线性等,另外筛选出显著特征、反复理解业务,有时候数据特征选择的好,依靠简单的算法也能得出良好稳定的结果,需要进行特征有效性分析,如相关系数、卡方检验、平均互信息、条件熵、后验概率、逻辑回归权重等方法)
  4. 训练模型与调优(现在很多算法都已经封装成黑箱供人使用,正则考察的是调参的技术,需要对算法额原理深入理解,能发现问题的症结,来提出良好的调优方案)
  5. 模型诊断(确定调优的方向,如欠拟合 过拟合这种情况,一般过拟合是增加数据量和降低模型复杂度的思路,欠拟合是增加特征,增加模型复杂度)
  6. 模型融合(一般提升模型主要在前期的数据清洗和预处理部分,以及后面的模型融合下功夫,有时候会通过在已有预训练模型上进行再融合和调参节省时间,并能取得不错的效果)
  7. 上线运行(模型在线上运行效果直接决定模型的成败,运行的速度、资源消耗成都、稳定性等是否可以接受)
 类似资料:
  • 本章中,你会假装作为被一家地产公司刚刚雇佣的数据科学家,完整地学习一个案例项目。下面是主要步骤: 项目概述。 获取数据。 发现并可视化数据,发现规律。 为机器学习算法准备数据。 选择模型,进行训练。 微调模型。 给出解决方案。 部署、监控、维护系统。 使用真实数据 学习机器学习时,最好使用真实数据,而不是人工数据集。幸运的是,有上千个开源数据集可以进行选择,涵盖多个领域。以下是一些可以查找的数据的

  • 本文向大家介绍说说vue-router完整的导航解析流程是什么?相关面试题,主要包含被问及说说vue-router完整的导航解析流程是什么?时的应答技巧和注意事项,需要的朋友参考一下 1.导航被触发 2.在即将离开的组件里调用beforeRouteLeave守卫 3.调用全局前置守卫beforeEach守卫 4.在重用的组件里调用beforeRouteUpdate守卫 / 调用路由配置的befor

  • 什么是机器学习? 机器学习是自动从数据中提取知识的过程,通常是为了预测新的,看不见的数据。一个典型的例子是垃圾邮件过滤器,用户将传入的邮件标记为垃圾邮件或非垃圾邮件。然后,机器学习算法从数据“学习”预测模型,数据区分垃圾邮件和普通电子邮件。该模型可以预测新电子邮件是否是垃圾邮件。 机器学习的核心是根据数据来自动化决策的概念,无需用户指定如何做出此决策的明确规则。 对于电子邮件,用户不提供垃圾邮件的

  • 本文向大家介绍你是怎么学习css的?说说你的学习方法相关面试题,主要包含被问及你是怎么学习css的?说说你的学习方法时的应答技巧和注意事项,需要的朋友参考一下 多练习各种布局理解布局原理 读 《css世界》

  • 我有一个流浪汉VM标准问题32。盒子在运转。在这上面设置指示灯的完整说明是什么? 我看过刀(厨师的一部分)并尝试: 但是得到 如何设置刀具配置文件,其中应该包含什么? 我一直在网上搜索答案,但被无法解释其出发点/先决条件的部分解决方案淹没了。 使现代化 我的目标是自己回答这个问题,因为似乎没有人愿意这样做。以下是我目前的理解——我的目标是在稍后用红色表示我的未知/问题。

  • 本章中,你会假装作为被一家地产公司刚刚雇佣的数据科学家,完整地学习一个案例项目。下面是主要步骤: 项目概述。 获取数据。 发现并可视化数据,发现规律。 为机器学习算法准备数据。 选择模型,进行训练。 微调模型。 给出解决方案。 部署、监控、维护系统。 使用真实数据 学习机器学习时,最好使用真实数据,而不是人工数据集。幸运的是,有上千个开源数据集可以进行选择,涵盖多个领域。以下是一些可以查找的数据的