当前页面
目录
POST https://api.vidu.cn/ent/v2/lip-sync
字段 | 值 | 描述 |
|---|---|---|
Content-Type | application/json | 数据交换格式 |
Authorization | Token {your api key} | 将{token}替换为提供给您的token |
参数名称 | 类型 | 必填 | 参数描述 |
|---|---|---|---|
video_url | String | 是 | 原视频 URL(需要确保可访问) 模型将以此参数中传入的视频为画面来匹配口型的视频 注1:视频仅支持格式:mp4、mov、avi; 注2:支持1 - 600秒,建议时长在10秒到120秒; 注3:文件大小不超过5G,单边像素需要在360p - 4096p 之间; 注4 :视频本身要求编码格式为 H.264 格式,若不是,可通过下述方法转换。请参见 编码格式转换; 注5:视频内容免涉肖像权,否则会被下架或销毁 注6:对于视频素材的规范性要求: * 人脸画面:要求真人出镜(如果是卡通人物,需要人物五官和真人比例相近),画面中的人脸说话时,建议正对镜头,水平转动不超过45度,俯仰不超过15度;人脸尽量不遮挡,面部光线稳定; * 说话音频:对音频无限制。 |
audio_url | String | 可选 | 音频文件url 对口型视频中使用的文字、音色,以音频文件的内容为准 注1:支持格式:wav、mp3、wma、m4a、aac、ogg 注2 :音频时长大于1s,小于600s 注3:大小要求:不超过100MB |
text | String | 可选 | 对口型视频生成时使用的文本内容 注1:文字内容不少于4个字符,不超过2000字符(2-1000个汉字或4-2000个英文); 注2:与audio_url同时有值时,以audio_url中的内容生成; 注3:段落切换用换行符标记; 注4:停顿控制:支持自定义文本之间的语音时间间隔,以实现自定义文本语音停顿时间的效果。使用方式:在文本中增加<#x#>标记,x 为停顿时长(单位:秒),范围 [0.01, 99.99],最多保留两位小数。文本间隔时间需设置在两个可以语音发音的文本之间,不可连续使用多个停顿标记; 注5:停顿控制示例:你好<#2#>我是vidu<#2#>很高兴见到你 |
speed | Float | 可选 | 语速,默认为1.0 * 1.0为正常语速,范围[0.5, 2],值为0.5时播报语速最慢,值为2时播报语速最快; * 仅文字生成时生效 |
voice_id | String | 可选 | |
ref_photo_url | String | 可选 | 用户上传的人脸参考图 URL 输入视频中包含多张人脸时,对口型 API 仅能选择一张人脸作为目标匹配口型,此参数可以用来指定人物作为目标。 若不输入人脸参考图,默认将选择视频中第一个有人脸的画面中,人脸占比最大的人物为目标。 注1:支持格式jpg、jpeg、png、bmp、webp; 注2:图像单边分辨率要求在192 - 4096px; 注3:文件大小不超过10MB; 注4 :图片内容需包含一张清晰的人物正脸,且为视频中出现的人物。 |
volume | Int | 可选 | 音量大小 * 范围 0 - 10,默认为0,代表正常音量,值越大音量越高 * 仅文字生成时生效 |
callback_url | String | 可选 | Callback 协议 需要您在创建任务时主动设置 callback_url,请求方法为 POST,当视频生成任务有状态变化时,Vidu 将向此地址发送包含任务最新状态的回调请求。回调请求内容结构与查询任务API的返回体一致 回调返回的"status"包括以下状态: - processing 任务处理中 - success 任务完成(如发送失败,回调三次) - failed 任务失败(如发送失败,回调三次) Vidu采用回调签名算法进行认证,详情见:回调签名算法 |
音频驱动调用示例
文本驱动调用示例
参数名称 | 类型 | 描述 |
|---|---|---|
task_id | String | Vidu生成的任务ID |
state | String | 处理状态 可选值: created 创建成功 queueing 任务排队中 processing 任务处理中 success 任务成功 failed 任务失败 |
payload | String | 本次调用时传入的透传参数 |
created_at | String | 任务创建时间 |
{ "task_id": "your_task_id_here", "state": "created", "payload":"", "created_at": "2025-01-01T15:41:31.968916Z" }