完美体育365-苹果发布论文,揭示Siri的秘密
- 发表时间:2024-02-19
- 来源:
- 人气:
苹果公司的跨平台 Siri 虚拟世界助手在全球具有多达 5 亿用户,似乎,语音辨识是苹果感兴趣的最重要领域之一。上周,苹果公司公开发表了一系列实印本研究论文,就如何改良语音启动时检测和说出人检验,以及多说出人的语言识别技术展开了研究。【 图片来源:Patently Apple 所有者:Patently Apple 】扬声器检验和语音启动时检测在第一篇论文中,一组苹果研究人员明确提出了一个训练过的人工智能模型,这个模型既能继续执行自动语音辨识任务,也能继续执行说出人辨识任务。正如他们在概要中所说明的,语音助手辨识的命令一般来说以启动时短语(例如,“嘿,Siri”)为后缀,检测这个启动时短语牵涉到两个步骤。
首先,人工智能必需辨别输出音频中的语音内容否与启动时短语的语音内容相匹配(语音启动时检测);其次,人工智能必需辨别说出者的语音否与登记用户或用户的语音相匹配(语音检验)。一般来说情况下,这两项任务都是被独立国家考虑到的。但有年出版者假设,对语音发起者的理解有可能有助推断出声音信号中的语音内容,反之亦然,这将有助对这两种属性展开评估。
回应,研究人员设计了三套需要自学语音和说出人信息的模型,并对一组数据展开训练,这些数据包括多达 16000 小时的带上注解的样本,其中 5000 小时的音频有语音标签(其余的为说出人标签)。不仅如此,还有多达 100 名受试者用于智能扬声器设备在一系列声学设置中为语料库作出贡献,还包括安静的房间、来自房间内电视或厨房设备的外部噪音,以及录音机以大音量播出音乐。值得一提的是,来自电视、广播和播客的 2000 小时不包括启动时短语的倒数音频记录也被加到进去,以此来测量“误报”亲率。
这些模型表明出有了自学语音和说出人信息的能力,同时在完全相同数量的参数下(按,掌控训练过程某些属性的变量),每个任务的准确性最少与基线模型完全相同。事实上,在明确提出的三种模型中,有一种在“多重”设置下的展现出高于说出者检验基线,在文本牵涉到的任务中相对于基线提升了 7.6%。研究人员指出,这样的实验结果是十分有意思的,因为这些模型是用于不相关的数据集训练的,也就是说,每个音频样本要么有语音标签,要么有说出人标签,根本没两者都有。
通过对结果的仔细观察,研究人员明确提出了一种灵活性的设计,通过相连有所不同的任务的训练数据,而不是为每个训练示例提供多个标签,从而在多个涉及任务上训练模型。从简单的角度来看,这样需要在两个任务之间分享计算出来可以节省设备内存、计算出来时间或延后,以及消耗的电量/电池。
【 图片来源:venturebeat 所有者:venturebeat 】错误启动时减轻在研究中,有一项补足研究增加了错误启动时的再次发生,也就是说,语音助手无意地忽视了像 Siri 这样的语音助手的语音。研究人员回应,他们用于了图形神经网络(GNN),这是一种操作者在图形结构上的人工智能模型,其中每个节点都与一个标签相关联,目标是在没基础事实的情况下预测节点的标签。在论文中,研究人员写到:语音启动时的智能助手一般来说在开始监听用户催促之前就不会检测到一个启动时短语……错误的启动时一般来说来自于背景噪音或听得一起类似于启动时短语的语音。
因此,增加误将启动时是建构以隐私为中心的非侵入性智能助手的一个最重要方面。在未来的工作中,该团队计划将基于GNN 的处置扩展到其他任务,例如用户意图分类。多语种说出人辨识在另一篇论文中,苹果研究人员探寻了一种针对多语言使用者量身自定义的说出人语言识别系统。他们回应,语音识别系统对大多数语言都有很高的准确性。
但是,当有多重语言经常出现时,这个语言识别系统的展现出就不尽如人意了。因此,基于这样的实行情况,研究人员要求积极开展说出人语言识别系统的工作。值得注意的是,《华盛顿邮报》近期委托展开的一项研究表明,谷歌和亚马逊生产的热门的智能音箱听不懂本土用户的语音比听不懂非美式口音的概率高达了 30%。
同时,像 Switchboard 这样的语料库也早已被证明对来自国内特定地区的使用者不存在可测量的弯曲,这个语料库还是被 IBM 和微软公司等公司用来取决于语音模型错误率的数据集。针对这种情况,年出版者将有关用于模式的科学知识统合到一个问答系统中,该系统需要为来自 60 多个地区的演讲者作出决策。其中,声学子模型将根据语音信号所传送的证据展开预测,而上下文感官预测组件则考虑到了各种交互上下文信号,通过这两方面的预测,来自由选择拟合的单语自动语音识别系统。
据理解,上下文信号包括了有关收到问答催促的条件的信息,还包括有关已加装的问答区域、当前自由选择的问答区域以及用户在发出请求之前否转换了问答区域的信息。最重要的是,它们有助在语音信号太短的情况下,依赖声学模型产生一个可信的预测。比如说,如果用户同时加装了英语和德语,像“naIn”这样的较短而模糊不清的语句,在德语中有可能是驳斥的“nein”,在英语中则是数字“nine”。另外,为了评估该系统,研究人员还研发了一种自定义指标,称作“平均值用户准确度”((公众号:)按,AUA,Average User Accuracy),他们指出这种指标能更佳地体现模型中的“人口水平”用于模式。
通过对多语言使用者的 128,000 个具备适当交互上下文信息的问答话语的内部语料库展开严格训练,它在所有语言人组中构建了平均值 87% 的准确性,同时将最好情况下的准确性相对于基线提升了 60% 以上。此外,在团队调整参数以均衡准确性和延后与在设备上运营模型的计算出来阻抗之后,平均值延后从 2 秒增加到 1.2 秒,而对 AUA 的影响不多达 0.05%。
录:本文编译器自venturebeat版权文章,予以许可禁令刊登。下文闻刊登须知。
本文关键词:完美体育365
本文来源:完美体育365-www.redsquirrelempire.com
- 2024-12-22完美体育365:库克单节突破惊人,再一次找到了手感
- 2024-12-22完美体育365_KD首次当选了全明星MVP 杜兰特竖起球迷心中的榜样
- 2024-12-22新年换新颜,用新衣诉说我们的故事【完美体育365】
- 2024-12-22完美体育365:虎牙重制版邀请赛6点开战 TeD钦定的男人会放嘲讽吗?
- 2024-12-22虎牙天命杯总决赛落幕,Snake-TC勇夺冠军‘完美体育365’
- 2024-12-22完美体育365|新加坡赛次日预测:EG异军突起 LGD难取胜
- 2024-12-22眼皮一单一双该怎么办|完美体育365
- 2024-12-22小秘诀:冰卷心菜叶贴胸可缓解乳房胀痛|完美体育365
- 2024-12-22取消“方便门诊”须有替代措施‘完美体育365’
- 2024-12-19完美体育365_爆森林狼与快船达成一致,锡伯杜希望巴特勒归队
- 2024-12-19完美体育365:火箭赛季总结:建灯泡组合 称霸惯例赛憾负西决
- 2024-12-19卡佩拉大帽杜兰特提士气 库里遭虐一哥眼神忧郁:完美体育365
- 2024-12-19“完美体育365”营销风向标,2017梅花网传播业大展北京站圆满落幕!
- 2024-12-19完美体育365_联盟情报局:未来战士锤石新皮肤即将上线!致命的一勾
- 2024-12-19完美体育365:T1大胜SB!老板Faker心情不错做了个手势
- 2024-12-19完美体育365-LOL宇宙更新 下一位新英雄是艾欧尼亚射手 网友:终于不是AD的爹了
- 产品中心标题一
用于生产保险粉,磺胺二甲基嘧啶安乃近,己内酰胺等以及氯仿,苯丙砜和苯甲醛的净化。照相工业用作定影剂的配料。香料工业用于生产香草醛。用作酿造工业防腐剂,橡胶凝固剂和
- 产品中心标题二
用于生产保险粉,磺胺二甲基嘧啶安乃近,己内酰胺等以及氯仿,苯丙砜和苯甲醛的净化。照相工业用作定影剂的配料。香料工业用于生产香草醛。用作酿造工业防腐剂,橡胶凝固剂和
- 产品中心标题九
岗亭,英文名字为Watch House,字面理解就是岗哨工作的小房子。在车场管理中,岗亭常常也称之为收费亭,是停车场管理人员收取停车费的工作场所,除此以外还可用作小区保安门卫值
- 产品中心标题八
岗亭,英文名字为Watch House,字面理解就是岗哨工作的小房子。在车场管理中,岗亭常常也称之为收费亭,是停车场管理人员收取停车费的工作场所,除此以外还可用作小区保安门卫值
- 0完美体育365-联盟情报局:LOL全球十周年庆典 免费限定皮肤大放送!
- 1“完美体育365”视频惊心!广西男子酒驾冲卡撞倒辅警,逃逸后竟趴在这躲避追捕
- 2打造视频营销新一极,西瓜视频将与抖音深度联动打造微综艺:完美体育365
- 3完美体育365-后羿嫦娥限定爆料!辅助梯度揭秘,瑶或成最大赢家!
- 4大帝与西蒙斯里应外合 最终76人大胜尼克斯取得连胜|完美体育365
- 5【完美体育365】接连作案!打包还原空首饰盒,这个“心细小偷”被抓了
- 6警惕自媒体“虚假繁荣”‘完美体育365’
- 7【完美体育365】不可思议!曾经王者马努-吉诺比利宣布退役
- 8正确饮水 女白领轻松排毒【完美体育365】
- 9完美体育365|放飞奇思妙想 谷歌科学挑战赛正在进行