全球旧事资料 分类
工作的系统(比如1415)。尽管现在在以上提及的研究领域已经有很多模型,这里我们仅讨论能够计算图像或者视频的显著图的模型(见下节的定义)。对于计算视觉注意力的计算模型的一般综合,包括偏向竞争10,选择调节15,注意力模型的规范化181,和其他模型,参考8。从心理学、神经生理学以及计算角度出
f发的注意力模型的综述,参考9771012202204224。图1显示了注意力研究的分类,并突出了我们的综述范围。
11定义尽管术语atte
tio
,salie
cy和gaze经常被相互替换使用,但是他们之间有更细微的描述他们的定义。注意力atte
tio
是一个普遍概念,覆盖了影响选择机制的各个方面,无论他们是场景驱动的自下而上的机制或者是预期驱动的自上而下机制。显著性salie
cy直觉上刻画了场景的一些部分,可能是物体或者区域,这些部分似乎相对他们的临近区域突出。术语“salie
t”通常在自下而上的计算模型1814中提及到。Gaze,一个眼睛和脑的协调运动,通常被用作注意力在自然行为中的代名词。(见99)。比如,一个人或者一个机器人必须和周围的物体进行交互,在场景中移动是控制注意点来执行任务。从这点讲,注意点控制同时集视觉,行
f为和注意力来执行感觉运动协调,这是某些特定行为(比如到达reachi
g和理解graspi
g)所必须的。12起源很多注意模型的基础能够追溯到Treisma
Gelades81,他们提出的“特征整合理论”陈述了那些视觉特征是重要的以及他们如何组合来在弹出式的和连续的搜寻任务中引导人们的注意力。Kocha
dUllma
18提出了一个前馈模型来组合这些特征,并引入了salie
cymap的概念,salie
cymap是表示场景位置突出性的地形图。他们同时引入了一个wi
ertakeall神经网络,这个网络选择最显著的位置,利用返回抑制机制使注意力焦点移向下一个最显著的位置。一些系统随即创建出来,利用相关模型来处理数字图像151617。KochUllma
模型的第一个完整的实现以及验证由Itti等人14提出(见图2),并应用于人造场景和自然场景。从此以后,这个领域受到持续的关注。基于不同对注意力模型的假设的各种各样的方法涌现出来,并在不同的数据库上进行验证。在接下来的章节中,我们提出一个统一的概念框架,在这个框架下我们将讨论每个模型相比其他模型的优点和缺点。我们将给作者深入的分析关于注意力模型的当前技术的发展,确定当前依旧面临的问题。
f对注意力建模的主要关注点在于如何,何时以及为什么我们选择行为相关的图像区域。由于这些原因,提r
好听全球资料 返回顶部