您的位置:首页 >创业 >

AI技术的突破: 通过8年级科学测试

作者: 凯德·梅茨

四年前,700多名计算机科学家参加了一场竞赛,以构建可以通过八年级科学测试的人工智能。线上有80,000美元的奖金。

他们都不及格。即使是最复杂的系统,在测试中也不能超过60%。人工智能无法与学生进入高中时期望拥有的语言和逻辑技能相提并论。

但是,周三,位于西雅图的著名实验室艾伦人工智能研究所 (Allen Institute for人工智能) 推出了一种新系统,该系统通过了测试,并有备用空间。在八年级科学考试中,它正确回答了90% 以上的问题,在十二年级考试中回答了80% 以上的问题。

这个名为Aristo的系统表明,在过去的几个月中,研究人员在开发能够理解语言并模仿人类逻辑和决策的AI方面取得了重大进展。

世界顶级研究实验室正在迅速提高机器理解和响应自然语言的能力。机器在分析文档,查找信息,回答问题甚至生成自己的语言方面越来越出色。

Aristo仅用于多项选择测试。尽管艾伦学院 (Allen Institute) 删除了所有包括图片和图表在内的问题,但它还是为纽约学生编写了标准考试。回答这样的问题需要额外的技能,将语言理解和逻辑与所谓的计算机视觉相结合。

一些测试题,例如八年级考试中的这一题,只需要信息检索即可:

一组共同工作以执行特定功能的组织称为:

(1) 器官

(2) 有机体

(3) 系统

(4) 牢房

但是其他人,例如同一考试中的这个问题,需要逻辑:

哪种变化最有可能导致生活在一个地区的松鼠数量减少?

(1)

(2)

(3)

(4)

在西雅图亿万富翁和微软联合创始人保罗·艾伦 (paul Allen) 成立实验室后,艾伦研究所 (Allen Institute) 的研究人员开始研究亚里士多德 (Aristo)-他们想建立一个 “数字亚里士多德” 2013年。他们认为标准化科学测试是典型AI基准的更有意义的替代方案,该基准依赖于国际象棋和双陆棋之类的游戏或仅为机器创建的任务。

科学测试不是仅仅通过学习规则就能掌握的。它需要使用逻辑进行连接。例如,森林大火的增加可能会杀死松鼠或减少它们繁衍生息所需的食物供应。

科学家们对Aristo取得的进步的热情仍然受到抑制,他们认为机器距离完全掌握自然语言还有很长的路要走,甚至离复制真正的智能还有很长的路要走。

“我们无法将这项技术与真正的人类学生和他们的推理能力相提并论,” 微软研究员刘晶晶说,他一直在研究许多与艾伦研究所相同的技术。

但是Aristo的进步可能会扩展到一系列产品和服务,从互联网搜索引擎到医院的记录保存系统。

“这具有重大的商业后果,” 负责艾伦研究所的前华盛顿大学教授Oren Etzioni说。“我能完全自信地说的是,你将看到全新一代的产品,一些来自初创公司,一些来自大公司。”

这项新研究可能会导致可以进行体面对话的系统。但这也可能鼓励虚假信息的传播。

“我们正处于这一阶段的早期阶段,” 杰里米·霍华德 (Jeremy Howard) 说,他负责旧金山另一个有影响力的实验室Fast.ai。“我们离潜力太远了,我不能说它会在哪里结束。”

2016年,当伦敦的一个实验室建立了一个可以在古代围棋比赛中击败世界上最好的玩家的系统时,它被广泛誉为人工智能的转折点。

然而,Etzioni的兴奋被消除了。他说,人工智能并没有看起来那么先进,他指出,早期的艾伦研究所 (Allen Institute) 的竞争使AI系统陷入了八年级的科学测试。

艾伦研究所 (Allen Institute) 在先前的努力上的改进比包括Etzioni在内的许多专家所期望的要快得多。

它的工作主要由神经网络驱动,这是复杂的数学系统,可以通过分析大量数据来学习任务。例如,通过精确定位成千上万张狗照片中的模式,神经网络可以学习识别狗。

近几个月来,世界领先的人工智能实验室已经建立了精心设计的神经网络,可以通过分析人类写的文章和书籍来学习语言的变幻莫测。

在Google,研究人员建立了一个名为Bert的系统,该系统梳理了数千篇Wikipedia文章以及庞大的浪漫小说,科幻小说和其他自行出版的书籍的数字图书馆。

通过分析所有这些文本,伯特学会了如何猜测句子中缺少的单词。通过学习一项技能,伯特吸收了有关语言构建基本方式的大量信息。研究人员可以将这些知识应用于其他任务。

艾伦研究所在Bert技术之上建立了Aristo系统。他们给伯特提供了广泛的问题和答案。及时,它学会了自己回答类似的问题。

不久前,实验室的研究人员将他们的考试系统的行为一次定义为一行软件代码。有时他们仍然会进行艰苦的编码。但是现在,该系统可以自行从数字数据中学习,因此可以以更快的速度进行改进。

像Bert这样的系统-称为 “语言模型”-现在推动了广泛的研究项目,包括旨在识别虚假新闻的对话系统和工具。随着更多的数据和更多的计算能力,研究人员相信这项技术将继续改进。

但是Etzioni强调,这些系统的未来很难预测,语言只是难题的一部分。

Liu和她的微软研究人员试图建立一个可以通过研究生记录考试的系统,该考试是进入研究生院所需的考试。

她说,语言部分是可行的,但是建立数学部分所需的推理技能是另一回事。“这太具有挑战性了。”

相关推荐

猜你喜欢

特别关注