Click to upload or drag and drop
Supported formats: MP4, QUICKTIME, X-MATROSKA Maximum file size: 500MB
Video asset URL
Click to upload or drag and drop
Supported formats: MPEG, WAV, X-WAV, AAC, MP4, OGG Maximum file size: 10MB
Target pure vocal audio URL; used to drive video lip movements.
Service identifier
Enable vocal separation to suppress background noise.
Whether to enable scene segmentation and speaker identification. Supported only in Basic mode.
Supported in lite mode. Whether to loop the video when the audio is longer than the video.
Supported in lite mode. Whether to loop the video in reverse (backward). Requires align_audio to be set to true.
Supported in lite mode. Start time of the template video, in seconds.
no output
火山引擎 V2V 唇形同步 API:AI 唇形同步与视频配音 API
接入火山引擎 V2V 唇形同步 API,实现自然无缝的 AI 唇形同步视频配音。高精度口型对齐引擎,支持大规模多语言视频翻译。现已在 Kie.ai 上线。

火山引擎口型同步 API 核心特性
帧级精准唇形同步
传统音频驱动方案往往会导致口型对齐不够精准,而火山引擎的深度学习模型实现了像素级的唇音精准对齐——即便是“p”和“b”等爆破音的微小唇部动作也能完美还原。生成效果自然流畅,轻松跨越“恐怖谷效应”。

多语言视频配音工作流
将唇形同步 API 与火山引擎视频翻译 API 结合使用,即可自动为视频生成 20 多种语言配音。该工作流能自动完成原声检测、文本翻译、语音合成及口型同步——集成于单一异步工作流中,一气呵成,无需任何人工干预。

原生生态集成
该 API 深度集成于火山引擎智能视觉服务,开箱即用,无缝对接字节跳动底层基础设施:涵盖自动转码、CDN 分发、去水印以及视频审核等能力。不用费劲拼凑多个服务——只需一个 API Key 就能搞定完整的视频生成流程。

高吞吐量异步任务处理
本 API 采用火山引擎 CVSubmitTask/CVGetResult 异步调用模式,支持并发提交数百个口型同步任务且不阻塞系统。各个任务独立处理,内置进度追踪、回调 URL 通知及失败自动重试机制——专为生产级内容工作流打造。

如何使用火山引擎视频口型同步 API
只需简单几步,即可快速上手体验我们的产品...
第一步:在 Kie.ai 注册并获取火山引擎口型同步 API 权限
在 Kie.ai 完成注册并生成专属的安全 API Key。该密钥用于身份验证,帮你全面体验火山引擎视频口型同步的各项生成能力,轻松满足多语言配音与批量处理需求。
第二步:通过 API 提交口型同步任务
使用你的 API Key 发送 POST 请求,传入源视频 URL、目标音频文件及配置参数。火山引擎口型同步 API 将通过 CVSubmitTask 异步处理你的请求,在几分钟内精准完成逐帧的唇部动作分析与声画对齐。
第三步:获取并分发口型同步视频
处理完成后,API 会返回任务状态与输出视频的 URL。如果您提供了回调 URL,火山引擎 Video-to-Video API 会将口型同步后的视频自动推送至您的应用,无缝集成到您的内容生产工作流中。
视频转视频口型同步 API 的热门应用场景
在线教育与课程本地化
为全球受众翻译教育视频课程,并实现精准的口型同步。新加坡某大学曾使用该 API 将超 200 小时的讲座内容配音为中文、印地语和印尼语——在通过精准口型同步保留讲师真实教态的同时,将本地化成本大幅降低了 70%。
社交媒体内容复用
TikTok 和 YouTube Shorts 的创作者只需一段源视频,即可将自己的口型完美复刻到多语言版本的视频中。一位旅游博主借助火山引擎的工作流,将一段英文视频重新制作成 12 种语言版本,在完全无需补拍画面的情况下,3个月内实现了海外订阅粉丝量 340% 的增长。
企业视频与全球营销
企业可借助口型同步 API 将产品演示、CEO 致辞及培训资料快速本地化,适配区域市场。某世界 500 强科技公司成功将 500 支产品教程视频本地化为日语、韩语和泰语,凭借高精度的口型同步效果一次性通过内部质检——全程无需重新拍摄。
影视配音自动化
后期制作工作室可通过集成该 API,实现外语配音中初步口型同步的自动化。火山引擎的核心引擎负责处理首轮的粗略同步,可减少 60% 的 VFX(视觉特效)人工时长——口型同步师只需微调极端的情绪表现,从而将配音制作流程从数周大幅缩短至数天。
火山引擎视频口型同步 API 常见问题解答
为您解答关于我们服务的常见问题。