Click to upload or drag and drop
Supported formats: MP4, QUICKTIME, X-MATROSKA Maximum file size: 500MB
Video asset URL
Click to upload or drag and drop
Supported formats: MPEG, WAV, X-WAV, AAC, MP4, OGG Maximum file size: 10MB
Target pure vocal audio URL; used to drive video lip movements.
Service identifier
Enable vocal separation to suppress background noise.
Whether to enable scene segmentation and speaker identification. Supported only in Basic mode.
Supported in lite mode. Whether to loop the video when the audio is longer than the video.
Supported in lite mode. Whether to loop the video in reverse (backward). Requires align_audio to be set to true.
Supported in lite mode. Start time of the template video, in seconds.
no output
Volcengine Video-to-Video Lip Sync API: API для ИИ-липсинка и дубляжа видео
Интегрируйте Volcengine Video-to-Video Lip Sync API для безупречного дубляжа и ИИ-липсинка в видео. Высокоточный движок синхронизации движений губ поддерживает массовый перевод видео на множество языков. Доступно на Kie.ai.

Ключевые возможности Volcengine Lip Sync API
Синхронизация губ с точностью до кадра
В отличие от традиционных методов на основе аудио с неточной синхронизацией, нейросеть Volcengine обеспечивает выравнивание звука и движений рта с точностью до пикселя. Она сохраняет даже сложную артикуляцию, например, взрывные согласные «п» и «б». Результат — максимально естественная речь без эффекта «зловещей долины».

Пайплайн для многоязычного дубляжа видео
Объедините Lip Sync API с Video Translation API от Volcengine для автоматического дубляжа видео на 20+ языков. Пайплайн распознает оригинальную речь, переводит ее, генерирует голос и синхронизирует движения губ — и все это в едином асинхронном процессе, не требующем ручного вмешательства.

Нативная интеграция в экосистему
API напрямую встроен в Intelligent Vision Service от Volcengine и работает с инфраструктурой ByteDance «из коробки»: автоматическое транскодирование, доставка через CDN, удаление водяных знаков и модерация видео. Больше не нужно объединять несколько сервисов — один API-ключ открывает доступ ко всему стеку генерации видео.

Высокопроизводительная асинхронная обработка задач
API использует асинхронную модель CVSubmitTask/CVGetResult от Volcengine, позволяя отправлять сотни задач по липсинку одновременно без блокировки. Каждая задача обрабатывается независимо: поддерживается отслеживание прогресса, доставка результатов по callback URL и автоматический повтор при сбоях. Идеальное решение для масштабных пайплайнов производства контента.

Как использовать API Volcengine Video-to-Video для липсинка
Начните работу с нашим продуктом всего за несколько простых шагов...
Шаг 1: Зарегистрируйтесь на Kie.ai для получения доступа к Volcengine Lip Sync API
Зарегистрируйтесь на Kie.ai и сгенерируйте защищенный ключ Volcengine Lip Sync API. Этот API-ключ необходим для аутентификации и открывает доступ ко всем возможностям генерации Volcengine Video-to-Video Lip Sync, включая мультиязычный дубляж и пакетную обработку.
Шаг 2: Отправьте задачу по липсинку через API
Используйте свой API-ключ для отправки POST-запроса с URL-адресом исходного видео, целевым аудиофайлом и параметрами конфигурации. Volcengine Lip Sync API обрабатывает ваш запрос асинхронно через CVSubmitTask, выполняя покадровый анализ движений губ и аудиовизуальную синхронизацию за считанные минуты.
Шаг 3: Получите и доставьте синхронизированное видео
После обработки API возвращает статус задачи и URL готового видео. Если вы укажете callback URL, API Volcengine Video-to-Video автоматически отправит результат с липсинком в ваше приложение для бесшовной интеграции в процесс производства контента.
Популярные сценарии использования API для синхронизации движений губ в видео
Онлайн-обучение и локализация курсов
Переводите и делайте липсинк обучающих видеокурсов для глобальной аудитории. Университет в Сингапуре использовал API для дубляжа более 200 часов лекций на китайский, хинди и индонезийский языки, снизив затраты на локализацию на 70% и сохранив оригинальную подачу преподавателя благодаря точному липсинку.
Адаптация контента для соцсетей
Авторы в TikTok и YouTube Shorts могут адаптировать движения губ под разные языки, используя лишь одно исходное видео. Тревел-блогер перевел одно англоязычное видео на 12 языков с помощью платформы Volcengine, увеличив международную базу подписчиков на 340% за 3 месяца — и всё это не переснимая ни единого кадра.
Корпоративные видео и глобальный маркетинг
Крупные компании используют Lip Sync API для быстрой адаптации продуктовых демо, обращений CEO и обучающих материалов под региональные рынки. Технологическая компания из списка Fortune 500 локализовала 500 обучающих видеороликов на японский, корейский и тайский языки, добившись такой точности липсинка, что ролики прошли внутренний контроль качества (QA) с первого раза — без необходимости пересъемок.
Автоматизация дубляжа для кино и ТВ
Студии постпродакшена интегрируют API для автоматизации чернового липсинка при дубляже на иностранные языки. Движок Volcengine берет на себя первичную синхронизацию, сокращая ручной труд VFX-специалистов на 60% — специалистам остается лишь доработать пиковые проявления эмоций, что радикально ускоряет процесс дубляжа, сокращая его с нескольких недель до считанных дней.
Частые вопросы об API Volcengine Video-to-Video Lip Sync
Здесь мы собрали ответы на частые вопросы о нашем сервисе.