来源: 时间:2022-09-10 17:35:10
谷歌周四为科学界推出了一个新的搜索引擎,这将帮助他们理解网上显示的数百万个数据集。这项名为数据集搜索的服务将帮助科学家、数据记者和极客找到他们的工作和故事所需的数据 -- 或者仅仅是为了满足他们的求知欲。新的搜索引擎将像Google Scholar一样工作,Google Scholar是该公司最受欢迎的学术研究和报告搜索引擎。
谷歌人工智能研究科学家娜塔莎·诺伊 (Natasha Noy) 在一篇博客文章中说: “数据集搜索可以让你在任何托管数据集的地方找到数据集,无论是出版商的网站、数字图书馆还是作者的个人网页。”
<iframe src = "https://www.dailymotion.com/embed/video/ k2czusufjdkcxufoo3" 宽度 = "100%" 高度 = "363"></iframe>为了创建数据集搜索,Google为数据集提供商制定了指南,以描述公司 (和其他搜索引擎) 可以更好地理解其页面内容的方式来描述其数据。
Noy说: “这些指南包括有关数据集的重要信息: 谁创建了数据集,何时发布,如何收集数据,使用数据的术语等。”
然后,Google收集并链接此信息,分析同一数据集的不同版本可能在哪里,并找到可能描述或讨论数据集的出版物。
谷歌表示: “我们鼓励大小数据集提供商采用这一通用标准,以便所有数据集都是这个强大生态系统的一部分。”
人们可以找到对环境和社会科学领域大多数数据集的引用,以及来自其他学科的数据,包括政府数据和新闻机构 (如propublica) 提供的数据。Google表示,数据集搜索可以使用多种语言,并且很快将支持其他语言。
相关推荐
猜你喜欢