Audiobox

Audiobox,Meta 出品,AI 音频生成研究模型,语音克隆/文本转语音,免费 Demo

音频音乐 付费 4 3
访问 Audiobox 官网

Audiobox 是什么?

Audiobox 是 Meta Platforms Inc.(原 Facebook)于 2023 年 9 月 27 日推出的 AI 音频生成研究模型,是 Meta 最先进的语音和音频生成系统,取代了之前的 Voicebox 模型。作为 Meta 的旗舰音频 AI 研究项目,Audiobox 定位为"用声音和文本输入生成音频的基础模型",展示了 Meta 在语音克隆、文本转语音(TTS)和音频生成领域的最新技术成果。平台托管于 Meta Demo Lab(audiobox.metademolab.com),面向公众免费提供实验体验。

Meta 出品·2023 年 9 月 免费研究 Demo 语音 + 文本双模输入

Audiobox 采用多模态架构,可同时接受语音录音和文本提示作为输入,这是其区别于前代 Voicebox 和其他竞品的核心特色。平台支持语音克隆(从短音频样本克隆声音)、文本转语音(将文本转换为自然语音)、音频生成(从文本描述生成音效和环境音)、声音填充(修改或扩展现有音频)等功能。用户只需描述所需音调、音高或风格,即可生成独特的 AI 语音,例如"大教堂中的风铃"等复杂音效。

核心功能

语音克隆
短音频样本克隆声音
文本转语音
文本提示生成自然语音
音频生成
文本描述生成音效/环境音
声音填充
修改/扩展现有音频

Audiobox 支持多种语言,输出音频质量高,适合研究演示用途。平台提供 Web 界面,用户无需安装任何软件即可体验 AI 音频生成功能,可生成音频样本、试听预览并下载到本地设备。相比 ElevenLabs、Play.ht、Murf AI 等商业化产品,Audiobox 的独特优势在于 Meta 强大的研究实力、语音 + 文本双模输入的创新架构、以及完全免费的研究 Demo 定位。但需要注意的是,Audiobox 目前仅作为研究项目,不提供商业 API,不适合商业应用场景。

研究定位:Audiobox 是 Meta 的研究演示项目,目前免费提供实验体验,但不提供商业 API。如需商业级语音克隆和 TTS 服务,可考虑 ElevenLabs、QCall.ai 等商业化平台。

产品信息

开发商
Meta Platforms Inc.
核心技术
多模态音频基础模型
价格方案
免费研究 Demo
支持平台
Web Demo·多语言

适用场景

AI 研究
音频生成技术实验
创意创作
独特语音/音效创作
原型设计
游戏/视频音效原型
教育演示
AI 音频技术教学展示
Audiobox

Audiobox

音频音乐

前往官网
audiobox.metademolab.com/

数据统计

浏览量 4
点击量 3
收录时间 2026-03-12
更新时间 2026-03-23

相关标签