MemoAI 是 AI 转写工具,可将音频和视频文件转换为文字,适合播客、会议、采访、课程和字幕整理。
TextToSpeech 是在线免费 AI 文本转语音工具,可将文本转换为自然流畅语音,并支持高质量音频下载。
Voicenotes 是语音笔记与会议记录工具,可录音、转写、生成摘要和行动项,并把会议内容变成可搜索报告。
Audiobox 是 Meta 曾开放的音频生成研究演示,当前页面提示演示已于 2026 年 2 月停止提供,仅适合作为研究项目资料查看。
Mubert 是面向视频、播客、App 和品牌项目的 AI 音乐生成平台,可按文本、情绪、时长和风格生成免版税背景音乐。
即构数智人创作平台基于形象声音克隆、文本驱动、语音驱动和云计算技术,帮助用户制作拥有本人形象和声音的短视频。
Boomy 是生成式音乐平台,可用 AI 创建和个性化歌曲,并围绕下载、发行和流媒体发布提供流程支持。
录咖是在线 AI 音视频处理平台,提供语音转文字、AI 字幕、文字转语音、视频翻译、视频切片、音视频总结、去水印、视频生成和 API。
Voicemaker 是在线文本转语音转换器,提供 1000+ AI 声音、130 种语言,并支持 MP3/WAV 下载、发音编辑和语音配置。
大饼AI变声 是 Windows 与 Mac 可用的 AI 变声器,提供丰富音色和 IP 音效,支持游戏、直播和软件内实时使用。
BeatBot 曾是 AI 歌曲生成入口,但当前 beatbot.fm 返回 410 Gone,已无法按正常在线工具使用。
Play.ht 曾提供 AI 文字转语音、声音克隆和语音 API;当前入口顶部提示服务已关闭,使用前必须重新确认可用状态。
beatoven.ai 是免版税 AI 音乐与音效生成平台,面向视频、播客、游戏和创作者生成可用于项目的背景音乐。
Producer.ai 当前跳转到 Google Flow Music,是面向歌曲生成、Remix、音乐视频和分享发布的生成式音乐创作平台。
WaveSpeedAI 是面向 AI 媒体生成的模型平台,聚合大量图像、视频和音频模型,并提供文档、CLI 和 API,适合把多媒体生成能力接入产品或创作流程。
逗哥配音是一款面向短视频创作者的 AI 配音软件,提供智能配音、文案提取、人声分离等短视频创作功能。
轻析 LiteSight 是 AI 视频内容提取与脚本创作工具,支持抖音、B站、快手、小红书、微博等链接解析,生成文案、思维导图、知识笔记和二创脚本。
Zorq AI 是 AI 图像与视频生成平台,支持图片、视频、声音克隆、LipSync 和 motion control,适合做多媒体创意与虚拟内容。
Ribbi 是偏创意生产的 AI Agent 平台,围绕图像、视频、音频和创意技能展开,适合用对话方式生成和组织多媒体内容。