Meta推出Seamless Communication AI翻译套件 支持近百种语言输入
Meta 最近公布了 AI 翻译套件 Seamless Communication,该套件由 4 款 AI 模型组成,可实现近百种语言输入、同声传译能力,并支持仅 2 秒延迟的翻译。
Meta 表示,该 AI 套件能够“精准再现说话者情绪”。其中,SeamlessM4T 模型可以在翻译时自动联想可能的后文,加速翻译过程。
另一款模型 Seamless Expressive 则可以解决传统 AI 翻译无法抓住用户语调、停顿、读词重轻度的问题,保存用户情绪、风格、说话速度、停顿和节奏,从而为翻译内容带来更多“情感信息”。
Seamless Streaming 是同声翻译模型,主打 2 秒延迟的语音和文字翻译,支持口译、听写翻译及自动语音识别功能。而综合模型 Seamless 则整合了上述三种语言模型,便于通用场景。
目前 Meta 已经将示例视频发布在 GitHub 以及 HuggingFace 网站上,感兴趣的小伙伴们可以点此进行查看。