就像Oxford Reference 里定义的:
“ground truth” refers to “the facts that are found when a location shown on a map, air photograph, or satellite image is checked on the ground, as validation
Ground truth是指:你在查看地图、航空照片或卫星图像上显示的位置时,从在地面上看到的实际情况,作为一种事实上的验证。
ground truth是“”事实上的真相“”,当我们有新的遥感测量方法,比如有一天我们可以可以通过黑魔法去预测向北100m外是否存在一个大城堡。
1.我们用无人机看到向北105m外确实有一个大城堡
2.我们使用黑魔法,嚯,黑魔法告诉我们说向北103m外确实有一个大城堡。
3.我们通过精度最高的实地测量,发现向北100m存在一个大城堡**【Ground Truth!】**
那么就我们现有的测量水平来说,第三条信息:向北100m存在一个大城堡;就是我们的ground truth。我们可以用向北100m作为金标准(golden standard)下的参考答案(标准答案)值。而“黑魔法”、“无人机”等其他的评价方法就要差一些。
故而,在机器学习中,准确地说在有监督学习,Ground Truth就是指我们给指定数据集打上的真实标签值:
比如这个图像是猫猫,那个图像是狗狗。;
比如“我爱你”对应的英文翻译是“I love you”;
比如“我喜欢你”对应的英文翻译是“I love you”;
比如“我宣你”对应的英文翻译是“I love you”;
比如这段视频中的动作是打鼓,那段视频中的动作是打球;
这段视频是正常,那段视频是异常;
自监督学习中,就是给定的pre task的正确答案。
强化学习中,强化学习按我个人的理解下是没有Ground Truth的,强化学习更多地是一种试错,通过不断地将算法奖励函数最大化。但是也不妨你把Ground Truth理解为你的特定想达到的目标,比如,一个你想拟合的目标神经网络。