当前位置: 首页 > 知识库问答 >
问题:

了解Weka中的成本敏感评估(成本矩阵)

长孙弘壮
2023-03-14

我使用的是Weka 3.7.1

我试图使用weka分析棒球运动预测。我想使用成本矩阵,因为在我赌博的体育书籍中,不同结果的成本是不一样的。我的数据集很简单:它是一组具有标称类{WIN, LOSS}的预测。对于这个问题,属性不是问题。

在WEKA资源管理器中,加载我的arff文件后,我可以从

分类-

以下是我想输入到成本矩阵中的值:

  • 正确分类为损失,成本为0(我没有下注)

注意,为了保持“成本矩阵”的真实性,我将利润设置为负值(与成本相反,它是利润);我将损失设置为一个正数(因为我输掉了赌注,这让我付出了代价)。

经过一些思考,我决定使用以下网格,我不知道我是否做得对,请让我知道我是否做得对:

 - a   b       <---- "classified as"
 - 0   1.0     a=LOSS
 - 0   -.909   b=WIN

这是我可能有错误的逻辑

(0,0) of grid=0: classified as LOSS, and was LOSS
(0,1) of grid=0: classified as LOSS, but was WIN
(1,0) of grid=1.0; classified as WIN, but was LOSS
(1,1) of grid=.909; classified as WIN, was WIN

当然,(0,0)和(0,1)表示预测损失的分类器,在这些情况下,我不下注,因此没有成本。

另一方面(1,0)和(1,1)表示分类器预测WIN并且在这些情况下我下注,因此存在关联的成本。

另一个非常混乱的项目:在我设置成本矩阵并执行分类器后,输出报告包含以下内容:

评估成本矩阵:

 0    1   
 0    0.91   <--- notice that this is not a negative value!

正如你所看到的,在报告(1,1)中,当我实际输入-.909时是0.91。我确实找到了另一个关于这个主题的帖子,但它没有解释为什么负值变成了正值。

提前谢谢你。请注意,这些是可以回答的问题;然而,如果你想提供一些指导,我将非常高兴,因为我是一个新手,仍在尝试建立一个理解框架。

共有1个答案

邹嘉致
2023-03-14

成本矩阵是一种改变决策边界阈值的方法。下文对此进行了解释。

http://research.ijcaonline.org/volume44/number13/pxc3878677.pdf

通过查看您的成本矩阵,似乎需要进行一些更正。

例如。

0    cost
cost 0

仅供解释:考虑以下成本矩阵:

a b
c d

这是我对两个类问题观察到的成本矩阵的一般格式。

现在,当你在a或d位置分类时,就没有必要合并成本。

但是当你在d点写了负价值作为成本时,它会造成混淆。(请解释一下,即你所说的负成本是什么意思。)

成本矩阵示例可以是:

0  1
10 0

也就是说,将示例分类为假阳性的成本是将类似示例错误分类为假阴性的成本的10倍。此外,正确分类示例不会产生任何成本。

 类似资料:
  • 这是最小成本路径动态规划问题的一个变体,让我难倒了。 我得到了一个成本矩阵MXN。成本矩阵有随机放置的正缓冲区和负成本。我从[1,1]开始,必须到[m,n]。我从一个初始缓冲区x开始。在我的遍历过程中,我的缓冲区x永远不应该<=0。如果它变成<=0,那么即使结束状态是一个正缓冲区,也是一个无效的路径(把它想象成一个玩家从一些初始健康开始,负成本扣除健康,而正缓冲区增加健康)。什么是最小的初始缓冲区

  • 我正在Weka中使用Metacost函数。我想查看分类器的总成本。有人能告诉我如何查看总成本吗?我正在使用Weka GUI浏览器。 我尝试在分类选项卡的“更多选项”部分启用成本敏感评估选项。但是,由于我必须输入两次成本矩阵(一次在元成本中,一次在更多选项部分),系统会返回元成本的总成本还是成本敏感分类器?我有点困惑。 提前谢谢你

  • 我正在尝试使用线性回归解决WEKA中数字属性的数字分类问题,然后我想在现有数据集上测试我的模型,并在当前测试数据集上重新评估模型。 作为评估的结果,我得到了总结: 相关系数0.9924平均绝对误差1.1017均方根误差1.2445实例总数17 但我没有这里显示的结果:http://weka.wikispaces.com/Making预言 如何让WEKA达到我需要的结果? 非常感谢。 要回答我的问题

  • 问题内容: 在C / C ++ / Java / C#中是否有相对简单易懂(易于实现)的局部敏感哈希示例? 我想了解更多有关此概念的信息,因此想在几个文本文件上尝试实现只是为了了解其工作原理,因此我不需要任何高性能或任何内容……仅是哈希示例对于相似的输入返回相似的哈希值的函数。我可以通过后面的例子从中学到更多。:) 问题答案: 对于字符串,您可以使用近似匹配算法。 产生随机字串 对于所有字符串,使

  • 问题内容: 我在Jenkins工作的 后期构建 步骤中使用以下代码: 所以它成功运行一个脚本,如果它 不 包含的功能。 如果在脚本中,我将定义一个 函数 ,例如: 然后我得到以下错误: 严重:类文件Set-BuildBadge $ addSummaryWithText java.lang.ClassFormatError中的非法类名称“ Set-BuildBadge $ addSummaryWit

  • 问题内容: 来自我的Web应用程序的XML响应既有HTML添加到页面,又有一些要运行的脚本。 我正在尝试从Web应用发送回XML,例如: 我现在正在做的是抢购和CDATA,将html插入页面并评估。 我正在寻找对我的方法的批评。任何人有什么建议吗? 问题答案: 您宁愿发送JSON,它也更易于解释。例: