BN层中有个参数use_global_stats,它表示是否使用caffe内部的均值和方差。 训练模型的时候,将BN层use_global_stats设置为false;测试的时候设置为true,不然训练的时候会报nan或者模型不收敛。