范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

击败OpenAI!谷歌公布20亿参数通用语音模型,支持100语种检测翻译

  智东西
  编译 | 吴菲凝
  编辑 | 李水青
  智东西3月7日报道,根据谷歌官网,谷歌的通用语音模型USM目前已实现升级,支持100多个语种内容的自动识别检测。
  去年11月,谷歌曾计划创建一个支持1000个语种的AI模型USM。谷歌将其描述为"最先进的通用语音模型",拥有20亿个参数,经过涵盖1200万小时的语音、280亿个句子和300多个语种数据集的预训练。
  USM的强大效果目前已在Youtube的字幕生成中展现出来,可自动翻译和检测如英语、汉语等主流语种,还能识别出阿萨姆语这种小众语种,可以说"精通方言"。
  根据谷歌博客,与OpenAI的大型通用语音模型Whisper相比,USM的数据训练时长更短,错误率更低。
  一、可自动检测翻译100+语种,USM面临两大挑战
  当微软和谷歌还在为谁家的AI聊天机器人更智能而争论不休时,我们需要清楚,语音模型的用途远不止于此。
  外媒The Verge的记者称,除了相传将在今年的I/O开发者大会中展示的20多款AI驱动产品之外,谷歌目前还在朝着更高目标迈进——构建一个支持1000种语种的机器学习模型。
  在周一发布的更新中,谷歌分享了更多有关USM的信息,谷歌称,这是构建支持1000种语言的通用语音模型的"关键第一步"。
  USM已被YouTube用于生成字幕,它还支持自动语音识别(ASR),可自动检测和翻译语言,不仅包括普通话、英语等广泛使用的语言,还包括阿姆哈拉语、宿务语、阿萨姆语等冷门语言。
  目前,谷歌称USM可支持检测100多个语种,并将作为构建更大的系统的"基础"。不过,这项技术似乎还有些遥远,谷歌在I/O开发者大会期间对阿拉伯语的错误表述就已证明。
  谷歌研究院科学家张宇(Yu Zhang)和软件工程师詹姆斯·秦(James Qin)在谷歌博客上发文称,为了实现USM这个雄心勃勃的目标,他们目前需要解决ASR面临的两个重大挑战。
  一是传统的学习方法的缺乏可扩展性。语音技术扩展到多语种的一个基本挑战是需要足够的数据来训练高质量的模型,使用传统方法时,需要手动将音频数据进行标记,既耗时又价格高昂,对于那些小众冷门的语种而言,也更难找到预先存在的来源收集。因此,研究院后续准备将传统学习方法转变为自我监督学习,利用纯音频来收集数据。
  二是在扩大语言覆盖范围和质量的同时,模型必须以计算效率更高的方法来改进。这就要求学习算法更加灵活、高效、泛化。这些算法需要使用来源广泛的数据,并在不用完全训练的情况下更新模型,再推广到新的语言中。
  二、三个步骤降低识别错误率,击败OpenAI
  据该团队发表的论文称,USM使用的是标准的编码器-解码器架构,其中解码器是CTC、RNN-T和LAS,编码器使用的是Conformer或卷积增强变换器。其中,Conformer使用的关键组件是Conformer块,由注意力模块、前馈模块和卷积模块组成,应用一系列Conformer块和投影层以最终嵌入。
  据论文显示,对于USM的训练共分为三个步骤。
  第一步是使用BEST-RQ来对涵盖数百种语种的语音音频进行自我监督学习,已经在多语言任务上展示了最先进的结果,在使用了大量的无监督音频数据后的证明结果是有效的。
  第二步需要使用多目标监督预训练来整合来自于其他文本数据的信息。该模型引入了一个额外的编码器模块来输入文本,并引入额外层来组合语音编码器和文本编码器的输出,并在未标记语音、标记语音和文本数据上联合训练模型。
  最后一步需要USM对下游任务进行微调,包括ASR(自动语音识别)和AST(自动语音翻译)。
  USM的整体培训渠道
  对于USM的有效性,团队通过Youtube Caption的多语言语音数据进行微调来验证。
  受监督的Youtube数据包括有73种语种,每个语种的数据不到3000小时。尽管监督的数据有限,但USM在73个语种当中实现了平均低于30%的单词容错率(WER),与当前内部最先进的模型相比降低了6%。与进行了近40万小时数据训练的大型模型Whisper相比,USM的错误率更低,它在18个语种中的解码错误率仅有32.7%,而Whisper有40%。
  在WER低于40%的情况下,USM在其支持的语言上优于Whisper
  在公开可用的数据上,与Whisper相比,USM在CORAAL(非裔美国人使用的英语)、SpeechStew和FLEURS这三个语言数据集上都显示出了更低的单词容错率。
  在ASR基准上比较USM(有或没有域内数据)和Whisper的结果。
  对于语音翻译,团队在CoVoST数据集上微调USM,在有限的监督数据上实现了最好的性能。为了评估模型性能的广度,他们根据资源可用性将CoVoST数据集中的语言分为高、中、低三类,并计算每个部分中的BLEU分数(机器翻译评价指标),根据最终展示出的结果,USM在所有细分市场上的表现都优于Whisper。
  他们认为,谷歌若想实现连接全球信息并使每个人都能自由访问的愿景,USM的开发将会是关键的一步,USM的基础模型框架和训练通道已经打下了一个基础,他们要做的就是在此基础上将语音模型扩展至1000种语言。
  结语:AI突破语言障碍,助全球打破信息茧房
  目前,USM已支持100多个语种,未来将持续扩展到1000多个,届时将会吸引到更大一部分用户进行体验,真正实现将信息分发到全球各个角落。
  信息时代,科技进步将会进一步帮助各个国家地区的语言和文化突破地域的限制,很大程度上解决信息茧房带来的困扰。

张翰到底有没有代表作近日张翰主演的电视剧7年未播被被法拍上了热搜。该剧起拍价2814万元但无一人出价竞拍。评估报告称若后续发行需要重拍女一号的相关内容今日头条娱乐榜热搜截图2021年,张翰宋丹丹郭麒麟陈道明的清醒,打了多少老戏骨的脸?文9号探秘人编辑9号探秘人爱情公寓有这样一个场景秦羽墨问唐悠悠言承旭和周渝民向你表白,你选谁?唐悠悠我选陈道明。的确,任何靠颜值取胜的偶像派在陈道明面前都不值一提。用陈道明的话来说刘亦菲周冬雨巴黎时装周无人问津?刘亦菲周冬雨谷爱凌看秀生图刘亦菲周冬雨谷爱凌造型一览,谁的颜值深得人心?刘亦菲周冬雨谷爱凌NewJeans李惠仁Zendaya赞达亚裴斗娜SophieTurnerChloGrace92岁黄夏蕙身家过亿却仍在卖唱,曾自曝长期接受政府资助及生果金92岁港星黄夏蕙去年八月宣布和现任丈夫潘炳烈移民美国,但短住小半年就返回国内工作,自曝将会在香港逗留3个月。3月7日,黄夏蕙公开出席慈善活动,慰问一众老者,并当众献唱歌曲,老街坊们主编温静丨今天发生了什么?重要消息国家广播电视总局组织审查4K超高清晰度电视节目录制规范4K超高清晰度电视节目文件格式规范超高清晰度电视节目制作系统分布式存储技术要求和测量方法IP交换矩阵技术要求和测量方法视觉海报赣鄱巾帼竞芬芳忠诚奉献谱新篇章又是一年丽人节,赣鄱巾帼竞芬芳。她们以中国女性特有的勤劳与智慧为经济建设和社会发展做出了重要的贡献,赢得了全社会的赞誉和尊敬。她们是全国三八红旗手,她们是行业里的精英,她们是推进中以现实的名义请求把三八妇女节改为三八夫男节三八妇女节是1857年3月8日,在美国纽约兴起,是各国妇女为了争取与男人各种权利平等,抵制社会对女性的歧视的一项运动。在全世界各国的妇女不断努力下,在许许多多有识之男士的大力协助下司马南,索马里渣男,看你怎么说!遥想司马当年,去了乌克兰。西装革履,舔脸笑嘻嘻。司马南,还记得当年你怎么说?乌克兰人民长得好看又善良,你说爱我们姐妹俩。司马南,看你今天怎么说!六月飞雪,令人心寒。索马里渣男,又黑这批预定新兵在万人冢遗址前这样做3月6日下午,潮阳区组织体检政考双合格预定新兵进行爱国主义教育,激发他们的爱国热情,坚定他们参军报国的信念。在海门莲花峰风景区万人冢遗址前,全体预定新兵整齐列队,整冠肃立脱帽,神情历史上功高震主,兔死狗烹的12位名将都是谁?自古以来,历史上的绝大多数君王都对国家的开国元勋或者是为国家做出过重大贡献的功臣有所忌惮。除了像宋太祖赵匡胤杯酒释兵权那样在酒席上谈笑风生间就拿到兵权,和自己的武将手下和解的这些少面包和玫瑰我在头条对她说在这温暖的三月,在这个全世界女神的节日里,不能忘记面包和玫瑰的口号,请允许我在头条对你们说说我内心的感激和崇高的敬意!我要对那些1857年3月8日在纽约街头抗议的服装
芯片卡脖子捅刀,受害者是谁?中国产业名片我们之前讲港股和香港,在一国背景下,中央支持下,港府取上策。昨天央行又发声,明确巩固香港离岸人民币中心地位,巩固提升国际金融中心地位。怎么提升?就是我们讲的中策,由美元双11别急着换新机,这几款更值得买或许上半年蛰伏太久,今年年底发布的新机都打算整一波大活,目前已经有部分搭载骁龙8Gen2和天玑9200的新机入网,涉及小米荣耀vivo等多个品牌。而这些充满了科技与狠活的新机最快会装修变成进货欧美佳强调约陈女士想装修老家的新房,2月份跟一家公司签了合同。她说原本说好总包八万元,装修到一半,公司说钱不够了。视频装修变成进货,欧美佳强调约陈女士在杭州工作,新房在老家安徽,给儿子结婚用的我国成功发射试验二十号C星视频加载中10月29日9时01分,我国在酒泉卫星发射中心使用长征二号丁运载火箭,成功将试验二十号C星发射升空,卫星顺利进入预定轨道,发射任务获得圆满成功。新华社发(汪江波摄)新华社战绩4胜1负,西部第二!重建队拒绝摆烂,火箭青年军惨遭暴击火箭客战爵士几乎全联盟都以为,在刚刚结束的休赛期当中,接连送走球队核心的爵士队,会在本次新赛季的征程当中,成为备受欺负的鱼腩队伍。但万万没有想到,那些还未被交易的老将,以及通过交易许昕现身开学典礼!穿休闲西装合影孙杨,刘诗雯参与国际乒联竞选日前,2022年WTT世界杯决赛正在河南新乡进行,今天进行男女单14决赛的争夺。没有获得参赛资格的许昕也没闲着,他现身长江商学院MBA2022级上海班开学典礼,与游泳奥运冠军孙杨成吉林想把首钢当作垫脚石,并由此起飞,这不,新惊喜来了头条创作挑战赛吉林想把首钢当做垫脚石,这不,他们的大礼包已经备好!吉林队想把首钢队当作新的垫脚石,因为如今首钢队的整体实力已经大幅度下滑。而且在吉林队看来,现在的他们更是典型的防守新东家收获两连胜,朱婷身披战袍定妆照曝光北京时间今天凌晨,20222023赛季意大利女排甲级联赛结束常规赛第二轮角逐,朱婷新东家斯坎迪奇俱乐部以3比0击败瓦莱福利亚俱乐部,开赛以来取得两连胜。尽管朱婷没有登场,不过她一直象棋杀棋练习五步杀432象棋杀棋练习五步杀,适合初级象棋爱好者,天天象棋业5以下水平可以练练。没有特别说明的都是红先胜。上期答案,仅供参考,部分棋局并非唯一解。1。马六进七将平2。炮一退一马进3。兵四进一同队俩三双,老兵张宁稳定发挥CBA常规赛山西迎来北京队的挑战,最终山西一分险胜北京,常林战旧主砍下101010经济三双,这是常林职业生涯第二次三双,值得一提的是常林生涯两次三双都是在本赛季获得,此前在对阵吉林Mac微信发布3。6。0测试版,加入多个新功能微信已经很久没有进行更新了,不过最近微信就进行了更新,只不过这次是Mac3。6。0测试版。这次的更新也加入了许多新功能,下面我们就来一起了解一下!首先,升级后加入了翻译图片中的文字