#多模态 - AI 工具标签筛选

VibePaper 是多模态 AI 创作平台，将图像、视频和文本生成整合到统一工作流和无限画布中，适合内容团队组织复杂创作项目。

Anakin.ai 是一站式 AI 应用平台，提供多模型接入、应用市场、内容创作、图像视频语音生成、智能 Agent、自动化工作流和批量处理。

Caffe 是 BAIR 和社区贡献者开发的开源深度学习框架，以表达性、速度和模块化为目标，曾广泛用于视觉、语音、多媒体研究与工业部署。

Replicate 是用云 API 运行 AI 模型的平台，可调用开源和官方模型，生成图像、视频、语音、音乐、Caption、LLM 输出，也可微调和部署自定义模型。

百度智能云一念是面向媒体内容生产的智能创作平台，基于 NLP、知识图谱和多模态 AI，覆盖策划、采编、审校和反馈等流程。

Gen-2 是 Runway Research 发布的多模态视频生成系统，可用文本、图片或视频片段生成新视频，支持 Text to Video、Text + Image to Video、Image to Video 和风格迁移等模式。

Seedance 2.0 是火山引擎面向专业创作的多模态视频生成模型，支持用图片、视频和音频素材做参考，并提供编辑、延长和衔接能力，适合追求更可控视频产出的团队。