您的位置:首页 >电信 >

人工智能系统通过上网提高性能

美国的研究人员开发了一种人工智能 (AI) 系统,该系统可以在internet上浏览,从可用的纯文本中提取信息,并在很短的时间内将其组织起来进行定量分析。最近,在计算语言协会关于自然语言处理的经验方法的会议上,来自麻省理工学院 (MIT) 计算机科学和人工智能实验室的研究人员获得了最佳论文奖,以表彰一种新的信息提取方法,该方法将传统的机器学习变成了现实。

大多数机器学习系统通过梳理训练示例并寻找与人类注释器提供的分类相对应的模式来工作。在他们的新论文中,麻省理工学院的研究人员对他们的系统进行了很少的数据训练-因为在他们正在调查的情况下,这通常是可用的。但是他们发现有限的信息很容易解决。

“在信息提取中,传统上,在自然语言处理中,你会得到一篇文章,你需要尽一切努力从这篇文章中正确提取,” 德尔塔电子电气工程和计算机科学教授Regina Barzilay说。“这与你或我所做的非常不同。当你阅读一篇你无法理解的文章时,你会在网上找到一篇你能理解的文章,”巴尔齐莱补充道,他也是该论文的资深作者。

机器学习系统为其每个分类分配一个置信度分数,这是对分类正确的统计可能性的度量,给定训练数据中识别的模式。

使用研究人员的新系统,如果置信度得分太低,系统会自动进行网络搜索,以提取可能包含其试图提取的数据的文本。然后,它尝试从其中一个新文本中提取相关数据,并将结果与其最初提取的结果进行协调。如果置信度分数仍然太低,它将移动到由搜索字符串拉起的下一个文本,依此类推。最终,系统将学习如何生成搜索查询,评估新文本与其提取任务相关的可能性,并确定融合多次尝试提取结果的最佳策略。

相关推荐

猜你喜欢

特别关注