请选择 进入手机版 | 继续访问电脑版

大唐名人网

 找回密码
 暂停注册
大唐名人网 门户 IT 查看内容

前沿|Gary Marcus:一味追求大数据是机器学习的误区,我们的算法所需数据更少且速度 ...

2016-5-26 10:28| 发布者: admin| 查看: 318| 评论: 0

  选自 MIT Technology Review

  作者:Tom Simonite

  机器之心编译

  参与:吴攀、盛威

  引言:人工智能创业公司Geometric Intelligence 说,跟时下人工智能领域一系列投资背后的算法相比,他们的学习算法能更快地掌握新技能。

  去年,微软和谷歌的图像识别算法都已表现出可通过学习打败人类的能力。他们各自搭建了自己的软件,进行了标准测试,让软件识别1000张各式各样的物体的图片,结果超过了平均的人类得分。

  但是,为了让软件足够强大能够对抗人类,这两个公司的软件都对120万张带标签的图片进行了仔细观察。而对一个孩子来说,只用一张样例图片,就能够识别一种新的物体。

  周一,创业公司 Geometric Intelligence 说,他们研发了一个可以更快学习的机器学习软件。该公司的 CEO Gary Marcus 在《MIT 科技评论》主办的 EmTech Digital 大会上曾说,如果要学习一项新的视觉任务,他们的 XProp 软件所需要的样品图片数量与现在机器学习软件的主流形式——即深度学习相比要少得多。

前沿|Gary Marcus:一味追求大数据是机器学习的误区,我们的算法所需数据更少且速度更快

  Gary Marcus

  Marcus 没有披露 XProp 的工作细节,但他展示了一张将 XProp 和某个深度学习程序在一项测试中的表现做对比的表格,该测试的内容是软件学习怎样识别手写体数字。

  表格显示,训练数据越多,两个系统性能就会越精确。但是在相同数量训练样例的情况下, XProp 的性能表现得更好。

  比如,XProp 学习过每个数字的大约150张手写图片后,识别新的数字图片,错误率只有约 2%。而对深度学习算法来说,为达到同样性能,则每个数字需要学习约 700 张样图。

  这并不代表 XProp 一定有实际用处。识别手写体数字差不多属于已解决的问题了。可用来训练的数据很多,而用深度学习软件得出的最好结果错误率已经达到了 0.2%。Marcus 展示的数字显示,随着训练数据的增多,XProp 相比于深度学习软件的优势就会下降。

  但是 Marcus 说,在谷歌街景项目收集的门牌号码照片的数据库中,XProp 的识别结果与上面那个实验相似,其他的图像识别测试中也是如此,这表明,该公司的技术可能具有广泛的可用性。

  大多数机器学习研究人员都认为会出现一些能够通过学习更少的数据运作起来的新技术。

  Marcus 说:「深度学习非常需要数据——而我们的学习速度则更快,我们的软件有时可以将所需数据量减少一半,有时甚至更多。」

  Marcus 是纽约大学的心理学教授,曾用几十年时间研究儿童的学习方式。他目前最困惑的一个问题是,语音及图像识别等由深度学习支撑的领域进展是否一定会帮助理解语言等更有挑战性的领域的进步呢?

  谷歌这样的大型计算公司通过将海量的标签训练数据集结到一起,已经有能力打造强大的语音和图像识别软件。Marcus 不否认这类科技将会带来成功的产品。但是,他相信,如果软件的性能要更加接近人类快速学习新技能,以及适应不断变化的环境的能力,那么需要更少数据量的算法就必不可少。

  「我们处在大数据的时代,而且很多人觉得只要投入更多数据就能解决问题,」Marcus 对 EmTech 的观众说,「但是面对有些问题的时候,并没有那么多数据可以提供。」

  他说,语言就是其中之一。人们的言语有无限种可能,将所有含义的语句归纳出来训练软件是不可能实现的。Marcus 还提到了无人驾驶汽车的例子,机器学习算法需要大量数据,在无人驾驶汽车中,这可能无法解决所有问题。

  他说,如果一辆汽车必须一遍遍地体验环境才能掌握技能,那么用每种可能的交通和天气情况训练车辆,可能耗时太长。

  本文由机器之心编译,转载请联系本公众号获得授权

  ------------------------------------------------

  加入机器之心(全职记者/实习生):hr@almosthuman.cn

  投稿或寻求报道:editor@almosthuman.cn

  广告&商务合作:bd@almosthuman.cn


相关阅读

投稿、合作、联系:admin2#tangedu.cn| 小黑屋|网站地图|大唐名人网 |京ICP备07504790号|

GMT+8, 2022-6-29 21:11 , Processed in 0.075577 second(s), 23 queries .

Powered by Discuz!

© 2001-2015 Comsenz Inc.

返回顶部