2018/12/27
今天在深度学习的教程中(见文集深度学习-kaggle学习1),看到了识别图像的解决方案,就想起来原来在sklearn上遇见的利用svm识别图像的范例。
这里遇见的问题其实并不是针对图像数字的识别问题。
而是说,我现在实践了这个操作流程之后,我发现我后续就不知道做什么了。
到底我这个算法好不好,是不是还可以后续改进。我就没有一个基准,然后就没有办法继续进行这部分
的内容了。
我已经利用混淆矩阵的方式打印出来了相应的结果,但是后面应该怎么做呢。
别着急,回想以前学习过的知识。
我还可以利用交叉验证的方式来看看是不是平均意义上是不是可以提高。
那么比如说,我后续用了交叉验证的方式之后,得到一个简单的回答,然后呢?
我并不是不知道哪些评价的标准,我只是不知道,如果我用完了这个东西,我怎么来下结论,我这个模型有多好。
我感觉,其实本质上,我在追求一个问题.就是当初胡书杰跟我说的,baseline的问题,他可以给我一个基准线,让我知道我这个算法是不是好的。或者说,我应该从数据分布的角度来看。
转载:https://machinelearningmastery.com/how-to-know-if-your-machine-learning-model-has-good-performance/
上面这个就提到了这个问题,给出的解决方案也是语言层面的。
下面这里提到了两个算法。
https://machinelearningmastery.com/implement-baseline-machine-learning-algorithms-scratch-python/
所以这个问题,并不是我凭空想出来的,的的却却由这方面需求。
可能我用别的模型就能对比出来不一样的地方。
2018/12/28
今天用sklearn中的dummy分类器实验了baseline的内容[1],因为选用的数据集并不是非常的麻烦,所以最后的结果显而易见。后续就可以按照这个模式先进行测试。
[1]sklearn的基准模型