小米 MiMo Token Plan 是 Xiaomi MiMo 开放平台的模型订阅方案,一次购买可使用 MiMo-V2-Pro、MiMo-V2-Omni 等模型,并包含 TTS 相关套餐权益。
MiniMax Token Plan 是 MiniMax API 开放平台的 Token 订阅方案,面向开发者和企业提供文本、语音、图像、视频等多模态模型调用额度。
MiniMax Audio 是 MiniMax 体系中的语音与音频能力,面向语音合成、声音克隆、多模态应用和开发者 API 场景。
ElevenLabs 是 AI 语音生成与 Voice Agents 平台,提供 5000+ 声音、70+ 语言、安全 API/SDK、语音合成和声音克隆等能力。
通义听悟是阿里云推出的工作学习 AI 助手,支持实时记录、音视频文件转写、全文摘要、章节速览、发言总结、待办事项、问答和翻译。
Agnes AI 是 Sapiens AI 的 AI Gateway、免费 API 与多模态模型平台,提供文本、图像、视频模型和面向开发者的 Token 套餐。
DeepL翻译是 AI 语言平台,提供文本、语音、文档和媒体翻译,DeepL Write 写作润色,实时语音翻译,以及可集成到产品中的 DeepL API。
面向创作者和私域运营的记录创作工具,支持图文笔记、AI 语音笔记、AI 听读、付费内容、画廊、PDF 上传与 OpenAPI/MCP。
Noiz AI 是 AI 文本转语音、声音克隆和声音设计工具,支持情感控制、多语言配音、声音库和开发者 API。
Murf AI 是 AI 语音生成与配音平台,提供 200+ 声音、35+ 语言、文字转语音、变声、AI Dubbing 和语音代理 TTS API。
IBM Watson文字转语音是 IBM 的 Text to Speech API,可将文本转换为多语言自然语音,并支持企业应用和 watsonx Assistant 集成。
Voice.ai 是 AI 变声与语音代理平台,提供实时变声、文字转语音、Voice Agents、语音克隆和面向企业的 API/SDK。
LongCat 是美团推出的 LongCat AI 模型与对话平台,覆盖推理、代码、多模态理解、图像、视频、音频和面向真实场景的模型能力。
Deepgram 是面向开发者和企业的 Voice AI 平台,提供语音转文字、文字转语音、语音智能体和实时/批量音频 API。
MiniMax 是 MiniMax 推出的综合 AI 体验入口,覆盖智能对话、视频创作、语音合成、虚拟角色、多模态理解和开发者 API 等能力。
WellSaid 是企业级 AI 语音生成平台,可将脚本快速生成专业旁白,并提供 Studio、团队协作、安全合规、API 和工具集成。
3D 具身智能数字人开放平台,提供数字人实时驱动、视频生成、语音合成、SDK 和 API 能力。
AssemblyAI 是 Speech AI API 平台,提供转写、流式语音转文字、语音理解、Voice Agent API 和音频数据洞察能力。
PixVerse 是 AI 视频生成与视频智能平台,提供文本、图像、音频、视频多模态建模、实时 1080P 交互生成、自动多镜头叙事和 PixVerse API。
博查AI搜索 是多模态 AI 搜索与开放平台,可为 AI 应用提供干净、准确、高质量的搜索结果,并支持多种官方搜索智能体。
MChat 是澜舟科技基于孟子 GPT 大模型推出的对话机器人体验,支持文本理解生成、多语言多模态任务、API 服务和企业部署。
Audo Studio 是一键音频清理工具,可自动去除背景噪声、增强语音、降低回声并调节音量,适合播客和视频口播。
阿里翻译是阿里巴巴的多领域多语种机器翻译服务,支持 200+语言,并提供文本、文档、图片、视频、语音等多模态翻译能力。
绘影字幕是在线视频字幕制作与翻译工具,支持语音识别、自动加字幕、双语字幕、SRT 在线编辑、时间轴对齐、实时字幕和开放 API。