支持以 120+ 种语言进行视频创作与实时互动。
视频以 MP4 格式生成;视频时长限制为 5 分钟(Studio 与 API)。
API 包含实时流式动画功能,文档见 docs.d-id.com。

D-ID 是一个数字人平台,专注于 AI 生成视频与互动式、面对面的虚拟形象体验。从官网来看,产品矩阵包括 Creative Reality™ Studio(Video Studio)、Visual AI Agents、AI Avatars、Video Translate、Video Campaigns、移动端 App 以及 API。
在 Creative Reality™ Studio 中,你可以基于脚本生成虚拟形象视频,也可以从 brief、演示文稿(deck)或文档生成,并以 MP4 输出。网站 FAQ 标注了关键限制与格式:视频以 MP4 生成,视频时长限制为 5 分钟(Studio 与 API),图片上传限制为 10 MB,支持的图片格式包括 JPEG/JPG/PNG。D-ID 还说明了多语言支持(120+ 种语言)以及品牌控制项,例如虚拟形象风格/声音与背景/版式/媒体。
在互动体验方面,D-ID 将 Visual AI Agents 定位为可嵌入的实时对话式虚拟形象,可在各类数字触点中使用。对于开发者,D-ID 提供其 API 的入门文档,其中包含实时流式动画能力。
基于脚本生成虚拟形象视频,也可从 brief、演示文稿(deck)或文档生成。
部署用于面对面互动并可嵌入数字触点的实时对话式虚拟形象。
从图片或视频创建逼真的数字人,用于离线视频与实时体验;网站提到支持声音克隆与多语言输出。
面向开发者的 API,提供文档与实时流式动画能力(docs.d-id.com)。
所有生成的视频均以 MP4 格式产出(据 FAQ)。
图片上传限制为 10 MB;支持格式包括 JPEG、JPG 与 PNG(据 FAQ)。
当你需要一致的呈现效果与快速更新时,可基于脚本、演示文稿(deck)或文档制作培训视频。
为营销活动生成多语言虚拟形象视频,并在不同地区实现本地化传播。
发布多语言支持视频,并部署互动式代理实时回答问题。
使用 API 将离线虚拟形象视频生成或实时流式动画集成到你的产品中。
这个工具适合:
通过 Studio 注册流程开始免费试用并访问创作工具。
选择预制虚拟形象、上传人脸图片,或使用 FAQ 中描述的文生图选项生成人像。
使用脚本制作视频,或按网站所述的 Video Studio 工作流从 brief、演示文稿(deck)或文档生成。
将最终输出生成为 MP4(据 FAQ),并将总时长控制在 5 分钟以内。
如需自动化或实时流式动画,请使用 API 并参考 docs.d-id.com 的文档。
如果你只是验证脚本与节奏,先选择一个预制虚拟形象,然后在内容定稿后再切换为上传图片或生成的人像。
FAQ 指出 Studio 与 API 视频限制为 5 分钟,因此可将较长内容拆分为章节并生成多个 MP4。
将源图片控制在 10 MB 以内,并使用 JPEG/JPG/PNG 格式以避免上传问题。