Vidu API
工作台
文档
登录

数据准备

1. 数据集要求

目前微调平台仅支持在 Vidu 2.0 图生视频模型(720p 分辨率)上进行训练。为确保微调效果,请严格按照以下要求准备数据:
  • 模型版本支持:当前仅支持 Vidu 2.0 图生视频模型(720p)
  • 内容匹配:数据内容需与目标生成一致(如"拥抱"视频必须真实包含该动作)
  • 数据量:推荐 100–200 条高质量视频片段
  • 分辨率:建议不低于 1080p(即视频分辨率 长 × 宽 大于 90 万像素)以确保足够的画面细节
  • 时长:每段 3–5 秒,优选处理为 4 秒,效果更稳定
  • 完整性:单一镜头,无剪辑,保证动作连贯完整
  • 干扰元素:不得含有水印、字幕等干扰视觉内容的元素
  • 画面比例:支持 16:9、1:1、9:16,避免使用非常规比例如 21:9
  • 数据类型:优先使用实拍素材,也支持高质量 AI 生成视频的数据
  • 音频:微调仅涉及视觉生成,上传的视频是否含音频均可,平台会自动去除声音
数据集质量对微调效果至关重要。请参考以下建议提升数据集有效性:
  • 质量优先:视频并非越多越好,统一、高质量的数据更关键。在内容一致性强的前提下,50 条高质量样本往往可取得优异效果
  • 避免错误样本:请确保每条数据准确无误。如出现无效片段(例如未完成的动作或明显错误的画面,如多余的手臂),即便仅有一两条,也可能显著影响模型性能
  • 适度覆盖:若目标任务涉及多种角色(如人与动物拥抱),建议在数据集中适当覆盖各类情况。模型具备一定泛化能力,无需大量扩展样本,但应包含关键场景以确保覆盖。

2. 参考案例

类型微调任务说明微调视频样例
特定动作实现公主抱效果

特定运镜镜头逆时针旋转

特效制作万物皆可开花

3. 数据集上传

  • 将您准备好的视频数据直接压缩为一个压缩包(不需要打包到文件夹里再进行压缩),在微调数据页面进行上传
微调数据
  • 点击创建数据集,填写数据集名称,根据您的微调任务类型选择数据集类型。
创建数据集
  • 另外,数据还可以在创建任务时上传。您可以根据提示,在创建微调任务时选择上传数据集。在任务提交后,该数据集也会同步保存到您的微调数据页面。
上传数据集