在世界上大约7000种已知的语言中,40% 没有标准的书写系统。这些没有文字的语言给现代机器学习翻译系统带来了一个独特的问题,因为翻译通常需要先将口头语言转换成书面文字,然后再将文字翻译成语音。然而, Meta在10月19日宣布,已经通过其最新的开源语言人工智能(AI)解决了这个问题。
Meta公司宣布“人工智能驱动的首个无书面语语音翻译系统”,成功翻译了台湾省主要使用的口语——闽南语。
这个系统是Meta的人工智能项目的一部分,被称为“通用语音翻译器(UST)”。该公司在一份声明中表示:“这个翻译系统是Meta AI通用语音翻译器项目的第一个里程碑,该项目专注于开发人工智能系统,提供所有语言的实时语音到语音翻译,即使没有书面语言。”该项目致力于开发更多实时语音到语音的翻译,以便元宇宙的居民能够更方便地进行交互。
Meta表示,在过去,人工智能驱动的大多数语言翻译工作都专注于书面语言,但其目标之一是翻译更多缺乏正式书写系统的语言。根据Meta的说法,目前有7000种 h/]语言,但“其中40%以上主要是口语,没有标准或知名的书写体系。”
Meta的首席执行官马克·扎克伯格(Mark Zuckerberg)在脸书发布的视频中演示了使用这一系统翻译闽南语,并表示Meta 将开源这一工具,以便人们可以使用新的人工智能系统来翻译更多的语言。