自学习与半监督学习:两者都是有少量的标注数据和大量的未标注数据的情况。两者的不同在于半监督学习要求标注数据和未标注数据有同样的分布,而自学习没有这种要求,因此具有更广泛的应用。
自学习包括两个部分,第一个是用无标签的样本集训练稀疏自编码器,第二个是用有标签的训练样本集训练softmax分类器。
具体过程如下:
第一步,设置神经网络的结构;
第二步,利用无标签数据集训练稀疏自编码器;
第三步,利用稀疏自编码器对有标签的训练样本集和测试样本集提取特征;
第四步,利用第三步提取的训练集特征及其标签集,训练softmax分类器。