一步一步:感知学习和对象识别中的特征检测和组合

一步一步:感知学习和对象识别中的特征检测和组合
刺激。(左上)嘉伯字母。当不受约束时,人类参与者在噪声中隐约看到Gabor字母(右上)。作为检测器,参与者在噪声中只有一个微弱的特征(左下),作为合成器,有一组检测到的不完美特征(右下)。在最后一种情况下,gabor的高对比度很容易被看到,但它是对原信特征的不忠实复制,这使得人们很难猜测原信是什么。版权所有©PNAS, doi:10.1073/ PNAS .1218438110

(欧宝娱乐地址Medical Xpress) -我们认出熟悉物体时的轻松和即时,却没有注意到。然而,一个新奇的、模棱两可的或高度复杂的物体需要练习才能达到这样的感知能力。过去的知觉学习研究发现,获得这些物体识别技能的速度有很大差异。然而,最近哈佛大学和纽约大学的科学家们设计出了一种区分特征检测和特征组合的方法,而且还确定了这两个步骤在感知学习过程中改善的速度。研究人员发现,虽然检测效率低、学习速度慢,但组合学习的速度是普通检测的4到7倍。此外,他们还展示了这是如何澄清先前知觉学习研究中获得的不同结果的。

纽约州教授丹尼斯教授和哈佛博士学生约旦W.苏丹在进行研究方面面临了许多挑战。这些包括设计用于分离检测和组合的方法,并揭示每个观察者学习的人员。“它被广泛认为“Suchow告诉Medical Xpress”进行两步进行。“首先,观看欧宝娱乐地址者检测到基本功能,如线段和暗和暗,然后查看器组合功能以形成对象。每次识别对象时,观看者都执行这两个步骤,而且他们不可能自愿地转动一步,只使用另一个。“

Suchow指出,单独测量这些步骤需要一个新技巧。Pelli补充道:“当我们发现不受约束的人类表现的效率是由这两个步骤单独测量的效率的乘积来预测的时,这是一件令人兴奋的事情。”

为了解决这个问题,SuchoW解释说,科学家设计了一对仿生学,每一个计算机程序最优地(也就是说,尽可能准确地)执行其中的一个步骤。“通过人工检测和计算机结合,或者反过来,我们可以单独测量每一步。因为是最佳的,如果人类和计算机一起表现得少于最佳,我们知道这是人类的错。“

Pelli还将其特征鉴定结果与视觉原语的特征提取的神经生物学相关,如大卫·哈奶和Torsten Wiesel所识别的那样。在他们的突破性1959年1哈布尔和威欧贝尔表明他们所谓的东西简单的细胞初级视觉皮层扮演着特征探测器的角色,也就是说,它们将图像与一个已知信号交叉关联在一个被称为接受领域概况。“众所周知,大脑必须以某种方式结合若干特征探测器的活动,以做典型的对象识别任务,”Pelli解释道。“然而,结合的规则仍然是神秘的。我们的结果证实了猜想识别过程可以通过两个步骤检测和组合建模。我们的方法追踪了架构的两个神经部分的非常不同的学习轨迹。”

关于大脑梭形面部面积的面部特异性,Pelli增加了,“我们的结果特别适用于一般的对象识别和特别是字母识别。特别是尤其是针对面部识别的新实验将是有趣的。”

仿生拐杖 - 理想的探测器和理想的组合器 - 是研究的关键组成部分。“这是两个不同传统的混合动力,”Pelli说。“信号检测理论指定最佳算法,而特征检测是人们如何识别的看似愚蠢的规则,即分两步。创新是为人类提供援助,为人类的援助提供最佳解决方案。”仿生拐腿使Pelli和SueOW可以评估人类受试者在每一步中的性能的效率。

一步一步:感知学习和对象识别中的特征检测和组合
八个Gabor字母。Indyeighteen字母的字母由Gabors组成。18个可能的引发中的每一个从垂直定向±45°,并且位于3×3栅格的九个位置之一。当右倾斜和左倾的Gabor重合时,它们形成格子花呢,但Vision仍然独立回应它们。我们假设讲师独立检测,因此每个Gabor是一个特征。有两个方向和九个地点,有18个可能的讲师,即功能。这里显示的八个字母是整个字母中的218个字母的随机选择的子集。请注意that within this subset, some features are common to many letters (e.g., six of the eight letters contain a right-tilted Gabor at the top right corner), whereas some features are common to just a few (e.g., two of the eight letters contain a right-tilted Gabor at the bottom left position). Copyright © PNAS, doi:10.1073/pnas.1218438110

同样重要的是研究结果(检测效率低下,缓慢学习,并以越来越快的速率组合)解释了许多报告的率的多样性研究-特别是关于复杂性和熟悉性的影响。“通过练习,”Suchow说,“人们学会看得更好,认识那些曾经太小、太模糊、变形或不熟悉的物体。这需要练习,而练习的量取决于任务。”

通过简单的任务 - 例如在计算机屏幕上检测到微弱的闪烁,他说明了 - 即使是多周的实践也有很少的改善。“我们认为这是因为这些任务主要依赖于检测机制,从而慢慢学习。”与其他任务 - 例如识别外国信函 - 有一个很大的改进,它发生得很快。“我们认为这是因为这些任务更依赖于学习来结合特征,以及结合机制快速学习。”

在下一步方面,SueN指出,他们的实验依赖于特殊构造的字母表,由所谓的Gabor字母,这在外观上与盲文相似,但从未见过或使用过。“将这种方法扩展到其他对象(例如面孔)的方法扩展到其他物体,”他补充说,同意Pelli。

苏州市也看到了他们的工作可能应用到其他领域的研究。“看东西通常是毫不费力的,但是,同样的,也有一些重要的情况下很难做到——例如,当物体很小、微弱、扭曲或不熟悉的时候。”在这些情况下,了解哪些视觉阶段限制了我们的感知和学习能力,可能会指导我们创造新的技术和设计,帮助我们视觉。”


进一步探索

自动图像分析由手工和机器学习产生

更多信息:学习检测并结合对象的特征,pnas.在线发布于2012年12月24日之前发布,DOI:10.1073 / PNAS.1218438110

有关的:
1猫纹状皮质中单个神经元的感受域,生理学杂志1959年10月;148(3):574-591

版权所有2013医疗Xpres欧宝娱乐地址s
保留所有权利。未经Phys.org / Medical Xpress书面许可,本材料不得全部或部分出版、广播、重写或重新分发欧宝娱乐地址

引文:一步一步:在感知学习和对象识别中的特征检测和组合(2013年1月11日)从//www.puressens.com/news/2013-01-feature-combination-perceptual -identified.html
此文件受版权保护。除作私人学习或研究之公平交易外,未经书面许可,任何部分不得转载。本内容仅供参考之用。
股票

反馈到编辑

用户评论