我从kaggle中选择了一个数据集作为我的类项目。这是数据集的链接。https://www.kaggle.com/iabhishekofficial/mobile-price-classification
在这个数据集中,有20个特征和一个名为“Price_range”的目标变量。这个目标变量有四个类别。低价,中价,高价,非常高的价格。现在,这个数据集已经编码如下:低价-0,中等价格-1,高价格-2,非常高价格-2
现在,根据我的理解,我认为这显然是一个分类问题,因为我不是预测手机的直接价格,而是预测手机价格的类别,无论是低价格还是中等价格,等等。现在的问题是,我的教授告诉我,这不是一个分类问题,相反,这显然是一个回归问题。所以,现在请帮我确定正确的事情。
虽然我确实认为这是分类问题,但请帮助我找出解决此问题的最佳情况。
您提供的链接的标题是分类数据集,而且标签列是一个分类变量,而不是数字值
正如你在问题中所说,如果你想预测手机价格,那么你可以使用回归,因为价格是连续的,但是如果你想预测手机的价格类别,那么它肯定会进入分类。
我正在编写一个递归函数,如下所示: 此函数用于接收员工并查找其管理者。如果找到管理器,则将管理器id推送到数组中($)- 所以我的问题是,如果我不在第6行返回递归调用(这是-
根据科罗拉多州罗斯国家森林区域树木类型的观测数据covtype.csv,实现树木类型识别任务 聚类之后,发现可视化的图不是自己想要的,我想要的是每个颜色都有自己的区域,但是运行结果不如意 到底要聚类还是分类啊
1 保序回归 保序回归解决了下面的问题:给定包含n个数据点的序列 y_1,y_2,...,y_n , 怎样通过一个单调的序列 beta_1,beta_2,...,beta_n 来归纳这个问题。形式上,这个问题就是为了找到 大部分时候,我们会在括号前加上权重w_i。解决这个问题的一个方法就是 pool adjacent violators algorithm(PAVA) 算法。粗略的讲,PA
1 基本概念 1.1 生存数据 生存数据就是关于某个体生存时间的数据。生存时间就是死亡时间减去出生时间。例如,以一个自然人的出生为“出生”,死亡为“死亡”。 那么,死亡时间减去出生时间,就是一个人的寿命,这是一个典型的生存数据。类似的例子,还可以举出很多。所有这些数据都有一个共同的特点, 就是需要清晰定义的:出生和死亡 。如果用死亡时间减去出生时间,就产生了一个生存数据。因为死亡一定发生在出生
问题内容: 我有一组Books对象, Book 类定义如下: 当 标题 是书,例如标题: JavaScript来假人 。 和 taglist 是我们示例的标签列表: Javascript,jquery,“ web dev”,.. 正如我所说,有一本书谈论不同的事物:IT,生物学,历史……每本书都有一个标题和一组描述它的标签。 我必须按主题自动将这些书分类为单独的集合,例如: 书: 傻瓜Java 假
spark.mllib提供了多种方法用于用于二分类、多分类以及回归分析。 下表介绍了每种问题类型支持的算法。 问题类型 支持的方法 二分类 线性SVMs、逻辑回归、决策树、随机森林、梯度增强树、朴素贝叶斯 多分类 逻辑回归、决策树、随机森林、朴素贝叶斯 回归 线性最小二乘、决策树、随机森林、梯度增强树、保序回归 点击链接,了解具体的算法实现。 分类和回归 线性模型 SVMs(支持向量机)