S
Stable Audio 是什么?
Stable Audio 是由 Stability AI 开发的 AI 音频生成平台。Stability AI 由英国 - 孟加拉裔企业家 Emad Mostaque 于 2019 年创立,总部位于英国伦敦,是领先的开放生成式 AI 公司,旗下产品包括著名的 Stable Diffusion 图像生成器、StableLM 和 Stable Audio。公司拥有数亿次模型下载量,2024 年 3 月 Emad Mostaque 卸任 CEO 但仍保持影响力。
Stability AI 出品
企业级
可微调模型
Stable Audio 2.5(2025 年最新版)提供文本生成音频、音频转音频、音频修复等核心功能,可生成最长 3 分钟、44.1kHz 立体声音质的完整音乐曲目。模型采用潜在扩散技术和先进音频压缩,T5 文本嵌入理解提示词,8 步生成流程(优于竞品),生成具有前奏、进展、尾声的连贯音乐结构,减少重复输出和音频伪影。
核心功能
文本生成音频
自然语言提示生成 3 分钟曲目
音频转音频
上传样本,文本提示转换风格
音频修复
编辑修改生成音频的特定片段
模型微调
企业可用自有数据集微调模型
平台基于 80 万 + 音频文件(来自 AudioSparx 库)训练,是企业首个专为企业级声音制作设计的音频模型。生成旋律、伴奏、分轨和音效,减少音频制作时间从数周到数分钟。提供免费版(非商用)和付费版(全商用权限)。
商用安全
完全授权训练数据集,付费计划享有免版税商用权限,企业客户可享受本地部署和定制模型微调服务。
产品信息
开发商
Stability AI
核心技术
潜在扩散模型/T5 文本嵌入
价格方案
免费 10-20 首 · Pro$11.99/月
支持平台
Web/API/本地部署
适用场景
音乐制作
音乐人快速创作 demo 和完整曲目
视频配乐
为 YouTube、短视频生成原创 BGM
游戏音效
为游戏生成背景音乐和音效
企业定制
品牌专属声音指南定制模型
音频音乐的其他工具
S
Suno
Suno,斯坦福孵化器出品,AI 音乐生成平台,1200 万 + 用户,完整歌曲创作
U
Udio
Udio,Stanford/DeepMind 团队创立,Sequoia 投资,AI 音乐生成,音质卓越,Suno 主要竞品
E
ElevenLabs
ElevenLabs,行业领先 AI 语音平台,100 万 + 用户,估值$33 亿,29+ 语言
N
Nafy AI
Nafy AI,2026 年上线,7 合 1AI 音乐创作平台,文本生成音乐/人声分离/歌词生成
F
Fryderyk
Fryderyk,AI 音乐创作助手,Web 应用,虚拟乐器,作曲编曲,云存储
K
Krisp
Krisp,全球领先 AI 降噪会议助手,双向降噪,转录摘要,2 亿 + 设备部署
M
Murf AI
Murf AI,美国 AI 语音平台,200+ 语音 45+ 语言,FALCON 低延迟引擎
S
Soundraw
Soundraw,日本 AI 无版权音乐生成,原创训练数据,支持分轨下载
V
Voice.ai
Voice.ai,澳大利亚实时变声软件,免费 AI 语音变换,千种用户创作声音
N
Notta
Notta,AI 语音转文字平台,58+ 语言,98.86% 准确率,500 万 + 用户