来源: 时间:2023-02-18 10:35:12
Google搜索现在将以相关的印度语言显示结果,即使用户使用英语或罗马字符键入其语言。该公司表示,此举旨在改善双语印度用户的搜索体验,即使他们对英语不太满意,他们也可能依靠音译来键入搜索查询。该公司还宣布了一种新的语言处理模型,称为印度语言的多语言表示或 “muril”,该模型面向印度语言。这是一种基于文本到文本的语言处理模型。
“印度独有的一种情况是,设备实际上是用英语设置的,与使用英语的设备进行交互比使用地区语言要容易得多。但是许多对母语非常满意的印度用户也可能正在使用英语设备,”工程总监-搜索和班加罗尔网站负责人Anand Rangarajan在与媒体的通话中解释说。
相关故事:补充说,很难用印度语言打字,这意味着用户通常最终依赖罗马或拉丁字符,即使是用当地语言进行的查询。 “这导致我们的系统检测到英语查询并显示英语结果。用当地语言为他们提供更好的服务。在接下来的几个月中,Google搜索现在将以相关的印度语言显示结果,即使它是用英语键入的。”
热门科技新闻现在点击这里了解更多
该功能将首先以五种印度语言推出: 印地语、孟加拉语、泰米尔语、泰卢固语和马拉地语。此外,Google正在将切换英语和地区语言之间的搜索结果的功能扩展到另外四种印度语言。这些是泰米尔语,泰卢固语,孟加拉语和马拉地语。该功能最初是四年前推出的。
此外,Google Maps应用程序现在将支持印度语言。地图应用程序将支持九种印度语言。用户将能够在应用程序中的语言设置并搜索地点,以他们喜欢的语言获取路线。
Google还增加了在印地语中获得家庭作业帮助的功能,这是Google Lens提供的功能。据该公司称,印度是使用Google Lens的第一大市场。
目前,学生可以在Google Lens中指向二次方程,数学问题,并获得英语解决方案。此功能也将扩展到印地语。当数学问题指向Google镜头时,它会将家庭作业问题的图像转换为查询。根据查询,它显示了分步指南和视频,以帮助解释问题。
Google还展示了一种用于自然语言处理的新方法,该方法是在印度开发的,称为印度语言的多语言表示或 “muril”。该公司表示,这是一种功能强大的新型多语言模型,可以在多种地区印度语言中进行扩展,并且还提供了对音译文本的支持,例如使用罗马脚本编写印地语时。以前的同类产品缺少此类功能。Google表示,MuRIL还擅长确定句子中的情绪。
“传统的方法是为每种语言建立一个模型,具体来说,说一个印地语模型和一个单独的泰米尔语模型,然后为我们想要涵盖的任何其他语言分别模型。因此,正如您可以想象的那样,这是一个非常劳动密集型的过程,因为大多数情况下,我们没有特定于语言的数据来为每种语言建立一个模型,”Google Research India的研究科学家partha Talukdar博士在电话中解释说。
他补充说,MuRIL是专门为印度语言设计的,用于我们在印度背景下看到的细微差别和特定用途。MuRIL是能够处理多种语言的单一模型,可以将培训和学习从一种语言转移到另一种语言。它目前支持16种印度语言和英语,因此总共支持17种。
另请阅读: 根据Talukdar的说法,新模型将充当桥梁或公共基础,将所有不同的语言映射到一个公共平台或框架中,从而使研究人员能够将知识和学习从一种语言转移到另一种语言。
塔鲁达尔 (Talukdar) 举例说明了MuRIL如何更准确,他指出,新模型将准确地解释诸如 “Achha hua account bandh nahi hua” 之类的文本。较早的模型会对此做出负面解释,但MuRIL正确地将其识别为肯定的陈述。
给出的另一个例子是MuRIL如何正确地将 “shirdi ke sai baba” 一词解释为关于一个人而不是一个地方。MuRIL是免费和开源的,可以在TensorFlow Hub上下载供研究人员使用。
相关推荐
猜你喜欢