如何让机器向人类大脑学习如何识别人脸

2018-11-28 来源:不详 浏览次数:

MIT的研究者们和他们的同事开发了一个新的关于人类大脑的人脸识别机制的计算模型,好像可以扑获到之前模型忽略掉的人类神经方面的信息。

研究者们设计了一个机器学习系统来实现他们的模型,他们通过提供一系列样本图片训练模型来识别特定的人脸。他们发现训练系统包括了一个中间处理步骤,表现为(代表)人脸的旋转角度-比方说,从中心旋转45度角-但不是旋转方向-左或者右。

这个特性并没有嵌入到这个系统;它是自然发生在训练的过程中。但是它重复实验观察到灵长类人脸处理机制的特征。研究者们认为这表明了他们的系统和大脑在做某些事情时是相似的。

“这并不能证明我们知道发生了什么事情”,TomasoPoggio说,他是MIT大脑与认知科学的教授,大脑,思维和机器中心(CBMM)的主任,CBMM是由美国国家科学基金会资助的多机构研究协会,总部设在MIT。他还说,“模型是一种现实版的卡通,特别是在生物学上。所以我会惊讶,事情是否会变得如此简单。但我认为这是强有力的证据,证明我们是在正确的轨道上。”

实际上,研究者们的新文章包含了对他们所使用的特定类型机器学习系统的数学证明,其目的是提出Poggio所说的“具有生物可信性”的神经系统模型,这将不可避免地会引入旋转角度的中间表示。

Poggio,是描述新研究工作的论文的资深作者,他是MIT麦戈文脑研究所的首要研究员,新工作的论文今天发表在计算生物学杂志上。他是通过其他几位CBMM和麦戈文脑研究所的成员与这篇文章联系到一块的:第一作者JoelLeibo,是谷歌DeepMind的研究员,他拿到了MIT脑与认知科学的博士学位,Poggio是他的导师;QianliLiao,是MIT电气工程和计算机科学专业的研究生;FabioAnselmi,是IIT

MIT计算和统计学习实验室的博士后,该实验室是一个MIT和意大利技术研究院合资创办的;WinrichFreiwald,洛克菲勒大学副教授。

◇◆◇◆◇

新兴属性

新的论文是“关于我们想在CBMM做的事情的一个很好的例证,一方面是机器学习和计算机科学的这种集成,另一方面是神经生理学和人类行为各个方面的集成,”Poggio说,“这不仅意味着大脑使用的算法是什么,还有大脑中实现这些算法的电路是什么。”

Poggio一直认为,大脑必须产生对面孔和其他物体“不变”的表示,即对象相对于观察者的距离,或对象在观察者视野中的位置,这些对象的空间定位对于对象的表示是无关紧要的。人类和猴子的大脑磁共振扫描很多也表明了这一点,除此之外,在年,瓦尔德发表了一项研究,更为详细的从神经解剖学角度描述了猕猴的面孔识别机制。

Freiwald展示了信息从猴子的视神经开始在一系列大脑位置中传递,相比于最后一个位置,其他位置对于人脸方向都是不敏感的。第一个区域的神经元对于特定的脸部方向才会有反应被激活;而最后一个区域的神经元,无论什么脸部方向都会激活它--一个不变的表示。

但是中间区域的神经元表现出“镜像对称”的特性:即他们对不涉及方向的脸部旋转角度比较敏感。在第一个区域,如果脸部向左旋转45度角则一个神经元集将会被激活,如果脸部向右旋转45度角则另外一个不同的神经元集将会被激活。在最后一个区域,无论脸部旋转30度,45度,90度或这些之间的任何角度,相同的神经元集都会被激活。但是在中间区域,脸部无论向左或向右旋转45度,一个特定的神经元集会被激活,向任何一个方向旋转30度另一个特定神经元集会被激活,等等。

这是研究者们的机器学习系统再现出来的行为。Poggio说,“它不是一个试图解释镜像对称性的模型,这个模型试图解释不变性,而且在这个过程中,有这样的其他属性冒出来了。”

◇◆◇◆◇

神经训练

研究者们的机器学习系统是一个神经网络,之所以叫这个名字,是因为它大致接近人类大脑的结构。一个神经网络包括非常简单的处理单元,排列成多层,上层和下层的处理单元或节点进行密集的连接。数据从网络的底层输入,进行某种处理后,将它们送入下一层,等等。在训练过程中,顶层的输出对应一些分类标准——即,正确判定一个给定的图像是否描绘了一个特定的人。

在早期的工作中,Poggio的小组已经训练了产生不变表示的神经网络,本质上讲,是记忆一组少量有代表性方向转向的人脸,Poggio称之为“模板”。当网络面对一个新面孔时,它将测量该面孔与这些模板的区别。当模版的转向与新面孔的转向相同时,这种差异是最小的,和他们相关的节点的输出将最终占主导地位直到信息信号到达顶层。最终根据新面孔和存储的面孔之间的测量差异,给出新面孔的确认识别结果。

在实验中,这种方法产生了不变表示:原来无论人脸的方向是什么,一个人脸的特征大体上是相同的。Poggio说,但是记忆模板这个机制是没有生物学依据的。

所以,新的网络使用了Hebb规则变化,它经常出现在神经学文献中,描述为“一起激发的神经元会连在一起”。这意味着在训练中,节点之间的连接权重会调整以产生更加准确的输出,节点对于特定刺激做出一致的反应比单独的做出反应(或没反应)会对最后的输出产生更大作用。

这种方法最后也同样地产生了不变表示。但是网络的中间层同样复制了灵长类大脑中间视觉处理区域的镜像对称反应。ChristofKoch是艾伦脑科学研究所的所长兼首席科学官,他说,“我认为这是重要的一步,在当今时代,当所有事情受控于大数据或大量的计算模拟,这个研究表明对于知识的原则性的理解可以解释一些令人费解的研究结果。”

Koch还补充到,“他们非常仔细,他们只看前馈通路-换句话说,在前80到毫秒内,猴子睁开它的眼睛,而且在这80到毫秒中,它可以识别出人脸并且给出此信号按下按钮。问题是在这80-毫秒中发生了什么,这个模型似乎很好的解释了这些。”

译者介绍

方小晗

数据挖掘攻城狮,机器学习爱好者,上海海事大学研究生,喜欢思考各种创新应用,挖掘大数据的价值,希望认识更多志同道合的小伙伴儿。

大数据分析挖掘后台回复“志愿者”

了解如何加入我们

往期精彩文章推荐,点击图片可阅读

年深度学习的全球重大进展

用TensorFlow生成周杰伦歌词









































白癜风初期能治好么
北京哪个医院看白癜风最好

转载请注明:
http://www.syzizu.com/sjbbzd/16897.html
  • 上一篇文章:

  • 下一篇文章:
  • 网站首页 版权信息 发布优势 合作伙伴 隐私保护 服务条款 网站地图 网站简介

    温馨提示:本站信息不能作为诊断和医疗依据
    版权所有 2014-2024
    今天是: