人工智能软件能够提供超过20种语言的翻译性能

网络新闻 3年前 (2022) admin
0

在Meta公司首席执行官马克·扎克伯格口之家的“世界上最快超级计算机之一”的支持下,该公司最新的人工智能模型现在可以翻译200种不同的语言软件,包括许多缺乏资源且不受当前翻译系统支持的语言软件。

“这意味着该技术将影响全球数十亿人,以便他们能够用自己的语言进行交流。”MetaAl研究科学家玛塔·R·科斯塔尤萨在项目宣传视频中指出。

“最关键的是,我们使用人工翻译基准数据集Flores-200来评估40,000多个翻译方向的翻译性能。”研究团队在解释这套Al模型论文摘要时指出。

研究人员还指出,该项目将涵盖更多低资源语言,从而减少数字不平等现象。

“由于“不掉一门语言”项目以减少全球数字鸿沟为宗旨,未来将越来越多的低资源语言纳入该项目的范围。”.叶子。

MRATA提出了一个新思路,利用多语言积累的大量双语平行文料并结合起来联合训练统─模型。

针对序列模型,一些研究人员很快提出了诸如MASS712和BART781等框架将预训练扩展到序列生成任务。

一个简单的解释是,人类在多语言学习过程中会自发总结相对抽象的共性语言,并专注于新语言的特点。

同样,对于机器翻译而言,能否将翻译能力迁移到不同语言上并使不同的语言之间的信息相互利用已成为一个非常有趣的问题。

MSIZ的设计目标是基于此考虑,设计通用预培训模型并学习语言之间转换的共性。它需要学习语言转换能力;其次,尽可能地了解通用语言的句子或词语,如果语义接近,则隐藏的空间中的声明也应接近。

为了确保不同语言的句子和词语可以嵌入同一空间,无论中文还是英文都应对应于相同方向表达,并引入了随机替换对齐技术RAS以创建更丰富的上下文。

SOCIALed SubversionPre-training...mRIG)成功实现了这种理想的模型:mSIZ可以通过预训练技术在特定语言上进行微调以达到领先的翻译效果,并在47个翻译测试集中全面显着改进。

版权声明:admin 发表于 2022-07-10 19:51:31。
转载请注明:人工智能软件能够提供超过20种语言的翻译性能 | 火资源软件