来源: 时间:2022-04-12 18:35:06
随着上周Google Assistant的广泛发布,语音助手大战如火如荼,苹果公司,Amazon.com公司,微软公司以及现在的Alphabet公司的Google都提供了电子助手来执行您的命令。
Siri是最古老的,包括西雅图艾伦人工智能研究所首席执行官Oren Etzioni在内的研究人员表示,苹果在理解语音和回答问题方面浪费了领先优势。
观看我们所有来自Express Technology的视频
但是Siri至少可以做一件其他助手做不到的事情: 说36个国家/地区的21种语言,这在大多数销售都在美国以外的智能手机市场中是非常重要的功能。
相比之下,Microsoft Cortana为13个国家/地区量身定制了8种语言。Google的助手始于其pixel手机,但已转移到其他Android设备,会说四种语言。亚马逊的Alexa仅提供英语和德语。Siri甚至很快就会开始学习上海话,这是仅在上海附近使用的吴语的特殊方言。
语言问题显示了数字助理要想成为操作智能手机和其他设备的无处不在的工具,仍然需要清除的障碍类型。对于任何助手来说,母语是复杂的。例如,如果有人在英国要求足球得分,即使语言是英语,助手也必须知道说 “两个零” 而不是 “两个零”。
在微软,一个由29人组成的编辑团队致力于为当地市场定制Cortana。例如,在墨西哥,一位出版的儿童读物作者写了Cortana的台词,以在其他西班牙语国家中脱颖而出。
“他们真的为真正的墨西哥人感到自豪。(Cortana) 有很多答案,这些答案既聪明又有趣,与成为墨西哥人意味着什么有关。”微软作家团队负责人乔纳森·福斯特 (Jonathan Foster) 说。谷歌和亚马逊表示,他们计划为助手带来更多语言,但拒绝进一步置评。
苹果公司演讲团队负责人亚历克斯·阿塞罗 (Alex Acero) 表示,在苹果公司,该公司开始研究一种新语言,方法是让人类阅读各种口音和方言的段落,然后用手抄录这些段落,这样电脑就可以准确地表示要学习的口语文本。苹果还以各种声音捕获一系列声音。从那里,建立了一个试图预测单词序列的语言模型。
然后,苹果用新语言部署了 “听写模式”,即文本到语音的翻译,Acero说。当客户使用听写模式时,Apple会捕获一小部分录音并使其匿名。这些录音加上背景噪音和含糊不清的单词,由人类转录,这一过程有助于将语音识别错误率降低一半。
Acero说,在收集了足够的数据并录制了配音演员以使用新语言播放Siri之后,Siri将发布,并回答Apple估计将是最常见的问题。发布后,Siri会更多地了解实际用户的要求,并每两周进行一次更新,并进行更多调整。但是,脚本编写无法扩展,名为Ozlo的智能助手的创建者Charles Jolley说。“你不能雇佣足够的作家来想出你需要的每种语言的系统。你必须综合答案,”他说。他说,那是几年的时间。
Viv是一家由Siri的原始创造者创立的初创公司,三星去年收购了该公司。Viv的首席执行官兼联合创始人达格·基特劳斯 (Dag Kittlaus) 表示: “Viv的构建是为了专门解决智能助手的扩展问题。”“要超越当今有限的功能版本,唯一的方法就是开放系统,让世界来教他们。”
相关推荐
猜你喜欢