ElevenLabs 是 AI 语音生成与 Voice Agents 平台,提供 5000+ 声音、70+ 语言、安全 API/SDK、语音合成和声音克隆等能力。
Voice.ai 是 AI 变声与语音代理平台,提供实时变声、文字转语音、Voice Agents、语音克隆和面向企业的 API/SDK。
亿话是数字人智能体创作平台,可创建数字人 IP 形象、训练大脑与音色、生成可实时对话的数字人和 PPT 视频。
AssemblyAI 是 Speech AI API 平台,提供转写、流式语音转文字、语音理解、Voice Agent API 和音频数据洞察能力。
3D 具身智能数字人开放平台,提供数字人实时驱动、视频生成、语音合成、SDK 和 API 能力。
WaveSpeedAI 是面向 AI 媒体生成的模型平台,聚合大量图像、视频和音频模型,并提供文档、CLI 和 API,适合把多媒体生成能力接入产品或创作流程。