当前位置: 首页 > 面试题库 >

问题:如果给你一些数据集,你会如何分类(我是分情况答的,从数据的大小,特征,是否有缺失,分情况分别答的);

宫瀚
2023-03-14
本文向大家介绍问题:如果给你一些数据集,你会如何分类(我是分情况答的,从数据的大小,特征,是否有缺失,分情况分别答的);相关面试题,主要包含被问及问题:如果给你一些数据集,你会如何分类(我是分情况答的,从数据的大小,特征,是否有缺失,分情况分别答的);时的应答技巧和注意事项,需要的朋友参考一下

参考回答:

根据数据类型选择不同的模型,如Lr或者SVM,决策树。假如特征维数较多,可以选择SVM模型,如果样本数量较大可以选择LR模型,但是LR模型需要进行数据预处理;假如缺失值较多可以选择决策树。选定完模型后,相应的目标函数就确定了。还可以在考虑正负样例比比,通过上下集采样平衡正负样例比。

解析:需要了解多种分类模型的优缺点,以及如何构造分类模型的步骤

 类似资料:
  • 本文向大家介绍你是如何给自媒体号做数据分析的?相关面试题,主要包含被问及你是如何给自媒体号做数据分析的?时的应答技巧和注意事项,需要的朋友参考一下 数据指标根据平台不同略有差异,这里以微信为例。 数据维度分为三个方面:用户属性,图文数据,其他(菜单栏数据,消息分析,接口网页),分析思维分三步走,收集汇总,整理分析,制定策略。 用户属性:收集清晰的用户数据,完整用户画像以及用户行为。公号里的用户分析

  • 本文向大家介绍请你介绍一下map的分类和常见的情况相关面试题,主要包含被问及请你介绍一下map的分类和常见的情况时的应答技巧和注意事项,需要的朋友参考一下 考点:java基础 java为数据结构中的映射定义了一个接口java.util.Map;它有四个实现类,分别是HashMap Hashtable LinkedHashMap 和TreeMap. Map主要用于存储健值对,根据键得到值,因此不允许

  • 问题内容: 当前,当我发出此SQL时,它将获得不同的用户名。 我有一些不同的用户名,它们代表组,例如。 我想将所有其他用户名(恰好是数字)分组为一个组,例如 我可以实现以下目标吗? 编辑:从答案修改的查询 问题答案: @bfavaretto很好(对他+1),但是如果您不了解前缀或前缀不同,则可以使用类似以下内容的方法:

  • 本文向大家介绍你是怎么做数据分析的?相关面试题,主要包含被问及你是怎么做数据分析的?时的应答技巧和注意事项,需要的朋友参考一下 考察的是数据分析的能力。主要从以下4个维度回答,结合具体的数据分析来进行阐述: 明确数据分析的目的; 确定数据分析的方法以及获取所需要的数据; 对数据进行预处理,并进行分析; 输出数据分析报告,提出相应建议。

  • 嗨,所有人, 我在不同的科目上有学生的分数。 表 #Maths 包含名为 a,b 和 c 的学生的数学分数。#Science和#English类似。 现在我想要的输出是,如果学生在两个科目上超过75分,他将被评为“优秀”。如果他的一门课超过75分,另一门课超过60分,那么他的成绩就是“及格”,如果没有一门课超过75分,而有一门课不到50分,那么他的成绩就是“不及格”。 请为结果提供解决方案? 谢啦

  • 本文向大家介绍Mysql索引会失效的几种情况分析,包括了Mysql索引会失效的几种情况分析的使用技巧和注意事项,需要的朋友参考一下 索引并不是时时都会生效的,比如以下几种情况,将导致索引失效:     1.如果条件中有or,即使其中有条件带索引也不会使用(这也是为什么尽量少用or的原因)   注意:要想使用or,又想让索引生效,只能将or条件中的每个列都加上索引   2.对于多列索引,不是使用的第