我目前正在研究人工神经网络、支持向量机和线性回归方法在基于气象因素(13个因素)的地区水果产量预测中的应用
在WEKA上实现这些方法时,我得到了不好的结果:就像在多层接收器的情况下一样,我的结果是:(我将数据集划分为28个用于训练,8个用于测试)==运行信息===
方案:weka。分类器。功能。多层Perceptron-L 0.3-M 0.2-N 500-V 0-S 0-E 20-H a-G-R关系:apr6\U数据实例:28个属性:15
构建模型所需时间:3.69秒
===测试集预测===
仪器#实际预测误差1 2.551 2.36-0.191 2 2.126 3.079 0.953 3 2.6 1.319-1.281 4 1.901 3.539 1.638 5 2.146 3.635 1.489 6 2.533 2.917 0.384 7 2.54 2.744 0.204 8 2.82 3.473 0.653
===测试集评估 === === 总结===
相关系数-0.4415平均绝对误差0.8493根均方误差1.0065相对绝对误差144.2248%根相对平方误差153.5097%实例总数8
如果使用SVM进行回归:inst#实际预测误差1 2.551 2.538-0.013 2.126 2.568 0.442 3 2.6 2.335-0.265 4 1.901 2.556 0.655 5 2.146 2.632 0.486 6 2.533 2.24-0.293 7 2.54 2.766 0.226 8 2.82 3.175 0.355
===测试集评估 === === 总结===
相关系数0.2888平均绝对误差0.3417根均方误差0.3862相对绝对误差58.0331%根相对平方误差58.9028%实例总数8
我的申请可能有什么错误?请告诉我!谢谢
我需要规范化数据吗?我想这是由WEKA分类器完成的。
如果要规范化数据,必须这样做。“预处理”选项卡-
如果要离散化数据,必须遵循相同的过程。
你可能会有更好的运气离散预测,例如低/中/高收益。
你需要规范化或离散化-这不能基于你的数据或单次跑步来说。例如,离散化为朴素贝叶斯分类器带来了更好的结果。对于SVM-不确定。
我没有从您的数据中看到您的精度、召回或F分数。但是正如您所说的测试集结果不好,那么您的分类器很可能遇到了过度拟合。尝试增加训练实例(我想36个太少了)。让我们发布当您增加训练实例时发生的事情。
问题内容: 我已经成功地训练了一个分类器(bayesnet),并构建了一个测试集 (ARFF格式),该测试集具有一个实例,但缺少一个值。 如何获得缺失值的预测?我已经 用GUI测试了两种ARFF结构(培训和测试)。他们工作。我根本不知道 如何获取预测值… 问题答案: 您要使用它将返回双精度值,即单值的预测。该方法适用于多个实例。
问题内容: 我已经成功地训练了一个分类器(bayesnet),并构建了一个测试集(ARFF格式),该测试集具有一个实例,但缺少一个值。 如何获得缺失值的预测?我已经用GUI测试了两种ARFF结构(培训和测试)。他们工作。我根本不知道如何获取预测值… 问题答案: 您要使用它将返回双精度值,即单值的预测。该方法适用于多个实例。
接口测试没有预期结果如何测试?(即没有接口文档中写的预期结果) 希望知道的小伙伴回答一下,谢谢!
我在DB中有时间戳格式,我的setEventDate方法需要日期格式。所以在我的刀课上有这样的东西: 我从数据库中获取时间戳,将其格式化为字符串,在下一步中,我将分析它的日期。我知道这听起来很奇怪。结果是:String-17:08 Date-Thu Jan 01 17:08:00 CET 1970 我不明白:/n我需要那种“HH:mm”格式。
问题内容: 我是使用Java在csv文件上进行一些数据处理的新手。为此,我使用Java的多线程功能(线程池)将csv文件批量导入Java并在它们的每一行上执行一些操作。在我的四核处理器上,多线程处理大大加快了处理速度。 我很好奇,知道多处理是否/将进一步加快操作速度? 如果是这样,某处有可用的教程吗?(《 Java基础教程》提到了一个类,但是我对语法的理解并不足够,无法自己理解该类: 来自http
我试图在朱莉娅做一个非常简单的逻辑回归。但是朱莉娅的打字系统似乎给我带来了问题。基本上,glm预测给了我一系列的可能性。我想做一个简单的循环,如果概率>=0.5,它是1,否则是0。我希望这些标签也是整数。