力模型(至少那些在自由注视的眼球运动的前几秒上测试的模型)能被统一到以下的普遍的问题称述中。假设K个观察员看了N副图,令是眼睛注视点以及他们对应的时间。对于第i副图的k个观察员的注视点的个数用表示。注意力模型的目的是找到一个函数(stimulisalie
cymap),这个函数最小化眼睛注视点预测的误差,也就是。这里一个重要的点是以上的定义更好的符合自下而上显式注意力模型,也许并不总是覆盖视觉注意力的其他方面。(比如显式注意力或者topdow
因素),这些不能用眼球运动来解释。
f这里我们对主要的应用于任意图像的注意力模型进行系统的综述。第二章将介绍分类这些模型的几个因素。在第三章,我们根据这些因素总结和分类视觉模型。第四章讨论这些模型的局限性和所遇到的问题。第五章对全文进行总结。2分类标准我们从引入13个标准f1f13开始,这些标准将用来对注意力模型进行分类。这些标准都源于注意力在行为和计算方面的研究。一些标准描述了模型(f1,f2,f3),其他的(f4f7,f12,f13)并不直接相关,但是他们对于觉得这些模型的实用性非常重要。21BottomupVSTopdow
模型模型之间一个主要的差别是他们是否依赖bottomup因素f1,topdow
因素f2或者是二者的组合。Bottomup因素主要基于视觉场景的特性(激励驱动)75,而topdow
因素(任务驱动)由认知现象如知识、期望、奖励和当前任务决定的。由bottomup方式吸引我们注意力的感兴趣区域必须充分地不同于与其周围特征。这种注意力机制同样叫做外在的,自动的,灵活的或者周边的因素78。
fBottomup注意力是快速的,无意识的,并最可能是前馈的。一个典型的bottomup注意力的例子是看一副在有很多条垂直条纹中只有一条水平条纹的场景图中,注意力马上就会被吸引到水平条纹上81。尽管很多模型属于这一类型,他们仅仅解释了眼球运动的一小部分,因为大多数注视点是由任务驱动的177。另一方面,topdow
注意力比较慢,任务驱动,有意识的和闭合回路的77。topdow
注意力最著名的例子是来源于1967年的Yarbus79,他展示了依靠当前任务的眼球运动的如下实验:测试者要求在不同的条件(问题)下看同一场景(在有一家人的房屋中,一个不速之客进入房间),这些问题包括:“估计这个家庭的物质环境”,“人们的年龄是多少”,或者简单的仔细观察场景。对于以上不同的例子,眼球运动明显不同。模型探索了三个主要的针对特定问题的topdow
因素的来源,这个问题是:我们如何觉得r