2022-07-08 18:03:49 +08:00
|
|
|
|
[#]: subject: "Meta’s AI Model That Helps Overcome Language Barrier Is Now Open-Source"
|
|
|
|
|
[#]: via: "https://news.itsfoss.com/meta-open-source-ai-model/"
|
|
|
|
|
[#]: author: "Rishabh Moharir https://news.itsfoss.com/author/rishabh/"
|
|
|
|
|
[#]: collector: "lkxed"
|
2022-07-09 18:40:51 +08:00
|
|
|
|
[#]: translator: "fenglyulin"
|
2022-07-08 18:03:49 +08:00
|
|
|
|
[#]: reviewer: " "
|
|
|
|
|
[#]: publisher: " "
|
|
|
|
|
[#]: url: " "
|
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
Meta 的帮助克服语言障碍的 AI 模型现已开源
|
2022-07-08 18:03:49 +08:00
|
|
|
|
======
|
2022-07-10 03:06:53 +08:00
|
|
|
|
Meta 的 No Language Left Behind (不落下任何语言)是一个宏大的开源项目,旨在以最高准确度翻译语言。
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
|
|
|
|
![meta][1]
|
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
Meta(Facebook 的前身)在开源世界做出了不小的贡献。Meta 除了专注于元宇宙(Metaverse)和其社交媒体平台外,还致力于各种研究和创新工作,比如 React(一个 JaveScript 库)。
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
现在,在 Meta 的研究人员决定开源一个叫“*No Language Left Behind(不落下任何语言)*”
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
### Meta 在 Leave No Language Behind 项目中的尝试
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
|
|
|
|
![200 languages within a single AI model: A breakthrough in high-quality machine translation][2]
|
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
目前,虽然世界上有大约 7000 个在使用中的语言,但大多数在线的内容都是以少数的流行语言来提供的,比如英语。这让许多不懂这些语言的人处于不利的地位。
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
虽然现存的许多翻译工具,但语法错误会让错误变得难以阅读和理解。另外,如果你想把内容翻译到一个不流行的语言(特别是非洲和亚洲的一些语言),翻译体验不会很好。
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
因此,Meta 正在开发有最高质量的翻译工具,可以帮助解决这一全球性的问题。
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
NLLB-200(No Language Left Behind,不落下任何语言) 是一个人工智能翻译模型,其可以翻译200多种语言。该模型在每种语言中的翻译性能是通过一个名为 FLORES-200 复杂数据集来确定和评估的。
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
正如 Meta 所说,NLLB 的翻译结果比以前的人工智能研究方法好40% 。对于一些最不常见的语言,其翻译准确率甚至超过70%。了不起的工作!
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
为了帮助开发项目和提高模型的翻译质量,Meta 向所有感兴趣的研究人员开放了源代码,包括 NLLB-200 模型、 FLORES-200 数据库、模型训练和重建训练数据库的代码。
|
|
|
|
|
|
|
|
|
|
你可以在 [GitHub][3] 上找到源代码,并且可以在项目的 [博客][4] 上了解有关该项目的更多信息。
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
### 对社会事业的鼓励
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
Meta 宣布向从事联合国可持续发展目标(UN Sustainable Development Goals)和翻译非洲语言的、任何地区的非营利组织和研究人员提供高达20万美元的捐赠,目前也鼓励其他学术领域如语言学和机器翻译的研究人员申请。
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
### 项目的影响
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
尽管 Meta 主要打算在其数字平台上,特别是在 Metaverse上使用 NLLB,但 NLLB 也有可能在其他领域产生巨大影响。
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
许多用户可以用他们的母语轻松地访问和阅读在线资源。项目开源后,社区应该能够帮助实现这个目标。
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
2022-07-10 03:06:53 +08:00
|
|
|
|
*你对 Meta的这个项目有什么看法?*
|
2022-07-08 18:03:49 +08:00
|
|
|
|
|
|
|
|
|
--------------------------------------------------------------------------------
|
|
|
|
|
|
|
|
|
|
via: https://news.itsfoss.com/meta-open-source-ai-model/
|
|
|
|
|
|
|
|
|
|
作者:[Rishabh Moharir][a]
|
|
|
|
|
选题:[lkxed][b]
|
2022-07-10 03:06:53 +08:00
|
|
|
|
译者:[fenglyulin](https://github.com/fenglyulin)
|
2022-07-08 18:03:49 +08:00
|
|
|
|
校对:[校对者ID](https://github.com/校对者ID)
|
|
|
|
|
|
|
|
|
|
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出
|
|
|
|
|
|
|
|
|
|
[a]: https://news.itsfoss.com/author/rishabh/
|
|
|
|
|
[b]: https://github.com/lkxed
|
|
|
|
|
[1]: https://news.itsfoss.com/wp-content/uploads/2022/07/meta-makes-ai-language-model-opensource.jpg
|
|
|
|
|
[2]: https://youtu.be/uCxSPPiwrNE
|
|
|
|
|
[3]: https://github.com/facebookresearch/fairseq/tree/nllb
|
|
|
|
|
[4]: https://ai.facebook.com/blog/nllb-200-high-quality-machine-translation/
|