S
Stable Audio 是什么?
Stable Audio 是由 Stability AI 开发的 AI 音频生成平台。Stability AI 由英国 - 孟加拉裔企业家 Emad Mostaque 于 2019 年创立,总部位于英国伦敦,是领先的开放生成式 AI 公司,旗下产品包括著名的 Stable Diffusion 图像生成器、StableLM 和 Stable Audio。公司拥有数亿次模型下载量,2024 年 3 月 Emad Mostaque 卸任 CEO 但仍保持影响力。
Stability AI 出品
企业级
可微调模型
Stable Audio 2.5(2025 年最新版)提供文本生成音频、音频转音频、音频修复等核心功能,可生成最长 3 分钟、44.1kHz 立体声音质的完整音乐曲目。模型采用潜在扩散技术和先进音频压缩,T5 文本嵌入理解提示词,8 步生成流程(优于竞品),生成具有前奏、进展、尾声的连贯音乐结构,减少重复输出和音频伪影。
核心功能
文本生成音频
自然语言提示生成 3 分钟曲目
音频转音频
上传样本,文本提示转换风格
音频修复
编辑修改生成音频的特定片段
模型微调
企业可用自有数据集微调模型
平台基于 80 万 + 音频文件(来自 AudioSparx 库)训练,是企业首个专为企业级声音制作设计的音频模型。生成旋律、伴奏、分轨和音效,减少音频制作时间从数周到数分钟。提供免费版(非商用)和付费版(全商用权限)。
商用安全
完全授权训练数据集,付费计划享有免版税商用权限,企业客户可享受本地部署和定制模型微调服务。
产品信息
开发商
Stability AI
核心技术
潜在扩散模型/T5 文本嵌入
价格方案
免费 10-20 首 · Pro$11.99/月
支持平台
Web/API/本地部署
适用场景
音乐制作
音乐人快速创作 demo 和完整曲目
视频配乐
为 YouTube、短视频生成原创 BGM
游戏音效
为游戏生成背景音乐和音效
企业定制
品牌专属声音指南定制模型
音频音乐的其他工具
S
Suno
Suno,斯坦福孵化器出品,AI 音乐生成平台,1200 万 + 用户,完整歌曲创作
E
ElevenLabs
ElevenLabs,行业领先 AI 语音平台,100 万 + 用户,估值$33 亿,29+ 语言
U
Udio
Udio,Stanford/DeepMind 团队创立,Sequoia 投资,AI 音乐生成,音质卓越,Suno 主要竞品
千
千音漫语
千音漫语,北京熠声科技出品,1800+AI 主播,100+ 语言,日免 20 万字符
海
海绵音乐
海绵音乐,字节跳动出品,国产 AI 音乐平台,灵感成曲,70+ 曲风,完全免费
讯
讯飞听见
讯飞听见,科大讯飞出品,语音转文字平台,98% 准确率,1 亿 + 用户,2016 年上线
音
音潮
音潮,自由量级出品,国产全自研 AI 音乐,15 秒成歌,专为中文优化,网信办备案
音
音述AI
音述 AI,深圳音述科技出品,全球首个 AI 音乐社区,GETI 法则,中文优化
M
MiniMax Audio
MiniMax Audio,300 亿美元估值,情感语音合成,语音转文字,100+ 语言,50 小时免费
N
NotebookLM
NotebookLM,Google Labs 出品,源接地 AI 笔记本,Audio Overview 播客式摘要,完全免费