英伟达致力于解决人工智能在多语言领域的难题

英伟达致力于解决人工智能在多语言领域的难题

Published on Aug 18
4分钟
Stella的AI小宇宙
0:00
0:00
<p># 英伟达致力于解决人工智能在多语言领域的难题 &nbsp;尽管人工智能看似无处不在,但它主要仅能在全球7000种语言中的极小一部分里发挥作用,这使得全球大部分人口被排除在其便利之外。英伟达正致力于填补这一明显的空白,尤其聚焦于欧洲地区。 &nbsp;该公司刚刚发布了一套功能强大的开源工具,旨在让开发者能够为25种欧洲语言构建高质量的语音人工智能。这其中包括主要语言,更重要的是,它为那些常被大型科技公司忽视的语言(如克罗地亚语、爱沙尼亚语和马耳他语)提供了生机。 &nbsp;其目标是让开发者能够打造我们许多人习以为常的语音驱动工具,从真正能理解你的多语言聊天机器人,到能瞬间响应的客服机器人和翻译服务。 &nbsp;这一计划的核心是“Granary”——一个庞大的人类语音库。它包含约一百万小时的音频,所有内容都经过精心筛选,用于帮助人工智能学习语音识别和翻译的细微差别。 &nbsp;为了利用这些语音数据,英伟达还提供了两款专为语言任务设计的新人工智能模型: &nbsp;- Canary-1b-v2,一款大型模型,在复杂的转录和翻译工作中具备高精度表现; &nbsp;- Parakeet-tdt-0.6b-v3,专为速度至上的实时应用场景设计。 &nbsp;如果你渴望深入了解其背后的科学原理,关于Granary的论文将于本月在荷兰举行的Interspeech会议上展示。对于急于动手实践的开发者而言,该数据集和两款模型已在Hugging Face平台上线。 &nbsp;然而,真正的精妙之处在于这些数据的创建方式。我们都知道,训练人工智能需要海量数据,但获取数据通常是一个缓慢、昂贵且极其繁琐的人工标注过程。 &nbsp;为解决这一问题,英伟达的语音人工智能团队与卡内基梅隆大学及布鲁诺·凯斯勒基金会的研究人员合作,构建了一条自动化流程。借助他们自家的NeMo工具包,他们能够将原始、未标注的音频快速处理成高质量、结构化的可用数据,供人工智能学习。 &nbsp;这不仅是一项技术成就,更是数字包容性的巨大飞跃。这意味着里加或萨格勒布的开发者终于能够构建能准确理解当地语言的语音人工智能工具,且效率更高。研究团队发现,Granary数据的效果极佳,要达到目标准确率,所需数据量约为其他热门数据集的一半。 &nbsp;这两款新模型充分展现了其能力。Canary堪称“性能猛兽”,其翻译...
英伟达致力于解决人工智能在多语言领域的难题 - Stella的AI小宇宙 - 播刻岛