什么是co-saliency?
2010年,Jacobs等人首次给出co-saliency的定义【cosaliency: where people look when comparing images】,指的是从一堆图像中找到特定的对象。
这种定义存在局限性,即必须采用同一镜头获取的相似图像来进行检测。这种局限限制了co-saliency的应用,即不具有通用性。
更受欢迎的定义是从多个图像中抽取common saliency。怎么理解这个common saliency呢?从检测图,应该是相似的显著性,例如:穿同种颜色球服的运动员。
怎么定位相似呢?
文献cluster-based co-saliency detection指出单幅图像的显著性检测容易忽略多幅图像的相关信息。什么意思?由其他图像提供信息?使用其他图像提供的信息?是不是与视频帧间信息很像呢?