VibePaper 是多模态 AI 创作平台,将图像、视频和文本生成整合到统一工作流和无限画布中,适合内容团队组织复杂创作项目。
Anakin.ai 是一站式 AI 应用平台,提供多模型接入、应用市场、内容创作、图像视频语音生成、智能 Agent、自动化工作流和批量处理。
Caffe 是 BAIR 和社区贡献者开发的开源深度学习框架,以表达性、速度和模块化为目标,曾广泛用于视觉、语音、多媒体研究与工业部署。
Replicate 是用云 API 运行 AI 模型的平台,可调用开源和官方模型,生成图像、视频、语音、音乐、Caption、LLM 输出,也可微调和部署自定义模型。
百度智能云一念 是面向媒体内容生产的智能创作平台,基于 NLP、知识图谱和多模态 AI,覆盖策划、采编、审校和反馈等流程。
Gen-2 是 Runway Research 发布的多模态视频生成系统,可用文本、图片或视频片段生成新视频,支持 Text to Video、Text + Image to Video、Image to Video 和风格迁移等模式。
Seedance 2.0 是火山引擎面向专业创作的多模态视频生成模型,支持用图片、视频和音频素材做参考,并提供编辑、延长和衔接能力,适合追求更可控视频产出的团队。