数据准备
1. 数据集要求
目前微调平台仅支持在 Vidu 2.0 图生视频模型(720p 分辨率)上进行训练。为确保微调效果,请严格按照以下要求准备数据:
- 模型版本支持:当前仅支持 Vidu 2.0 图生视频模型(720p)
- 内容匹配:数据内容需与目标生成一致(如"拥抱"视频必须真实包含该动作)
- 数据量:推荐 100–200 条高质量视频片段
- 分辨率:建议不低于 1080p(即视频分辨率 长 × 宽 大于 90 万像素)以确保足够的画面细节
- 时长:每段 3–5 秒,优选处理为 4 秒,效果更稳定
- 完整性:单一镜头,无剪辑,保证动作连贯完整
- 干扰元素:不得含有水印、字幕等干扰视觉内容的元素
- 画面比例:支持 16:9、1:1、9:16,避免使用非常规比例如 21:9
- 数据类型:优先使用实拍素材,也支持高质量 AI 生成视频的数据
- 音频:微调仅涉及视觉生成,上传的视频是否含音频均可,平台会自动去除声音
数据集质量对微调效果至关重要。请参考以下建议提升数据集有效性:
- 质量优先:视频并非越多越好,统一、高质量的数据更关键。在内容一致性强的前提下,50 条高质量样本往往可取得优异效果
- 避免错误样本:请确保每条数据准确无误。如出现无效片段(例如未完成的动作或明显错误的画面,如多余的手臂),即便仅有一两条,也可能显著影响模型性能
- 适度覆盖:若目标任务涉及多种角色(如人与动物拥抱),建议在数据集中适当覆盖各类情况。模型具备一定泛化能力,无需大量扩展样本,但应包含关键场景以确保覆盖。
2. 参考案例
类型 | 微调任务说明 | 微调视频样例 |
---|---|---|
特定动作 | 实现公主抱效果 | |
特定运镜 | 镜头逆时针旋转 | |
特效制作 | 万物皆可开花 |
3. 数据集上传
- 将您准备好的视频数据直接压缩为一个压缩包(不需要打包到文件夹里再进行压缩),在微调数据页面进行上传

- 点击创建数据集,填写数据集名称,根据您的微调任务类型选择数据集类型。

- 另外,数据还可以在创建任务时上传。您可以根据提示,在创建微调任务时选择上传数据集。在任务提交后,该数据集也会同步保存到您的微调数据页面。
