The text prompt describing the desired video motion
Click to upload or drag and drop
Supported formats: JPEG, PNG, WEBP Maximum file size: 10MB
URL of the image to use as the first frame. Must be publicly accessible
The duration of the generated video in seconds
Video resolution. Valid values: 720p, 1080p
Negative prompt to describe content to avoid
Whether to enable prompt rewriting using LLM
Random seed for reproducibility. If None, a random seed is chosen
Explore different use cases and parameter configurations
The text prompt for video generation. Supports Chinese and English, max 800 characters.
The duration of the generated video in seconds
The aspect ratio of the generated video
Video resolution tier
Negative prompt to describe content to avoid. Max 500 characters.
Whether to enable prompt rewriting using LLM. Improves results for short prompts but increases processing time.
Random seed for reproducibility. If None, a random seed is chosen.
Explore different use cases and parameter configurations
Complete guide to using
API Alibaba Wan 2.5 – Generación de videos con IA y audio sincronizado
De texto a video o de imagen a video, la API Wan 2.5 en Kie.ai ofrece imágenes cinematográficas, audio sincronizado y resultados flexibles, todo a un costo mucho menor.

Te presentamos la API Alibaba Wan 2.5 para crear videos con IA
Alibaba Wan 2.5 es un modelo de generación de videos con IA de última generación, diseñado para transformar indicaciones de texto e imágenes de referencia en salidas de video cinematográficas. Lanzado originalmente en la plataforma DashScope de Alibaba Cloud, demuestra capacidades avanzadas en realismo visual, dinámica del movimiento visual y sincronización de audio. Para facilitar la integración de estas características, Alibaba ofrece la API Wan 2.5, que incluye los endpoints para vista previa tanto de texto a video (T2V) como de imagen a video (I2V). Con las APIs wan2.5-t2v-preview y wan2.5-i2v-preview, los desarrolladores pueden generar videos cortos mejorados con sincronización de labios y sincronización de audio. Más allá de DashScope, Kie.ai ahora ofrece acceso directo a la API Wan 2.5, brindando a creadores y desarrolladores una forma más flexible y rentable de integrar la avanzada tecnología de video de Alibaba en aplicaciones, flujos de trabajo y proyectos creativos—siendo una alternativa sólida a Veo 3 de Google.
Métodos de Generación Compatibles con la API Wan 2.5
De texto a video (API wan2.5-t2v-preview)
La API wan2.5-t2v-preview permite a los desarrolladores generar videos directamente a partir de indicaciones de texto. Al detallar escenas, acciones y entornos, produce videos cinematográficos con movimientos suaves y audio sincronizado—perfectos para guiones gráficos, campañas de marketing y contenido para redes sociales.
De imagen a video (API wan2.5-i2v-preview)
La API wan2.5-i2v-previewRe-edición de copia traducida transforma imágenes estáticas en videos cortos y animados. Conserva la identidad y el estilo originales de la imagen mientras agrega animaciones realistas y cambios de perspectiva, siendo ideal para retratos, exhibiciones de productos y narrativas creativas.
Características principales que destacan la API Wan 2.5
Audio Nativo y Sincronización A/V Ideal con la API Wan 2.5
La API Wan 2.5 permite generar video con audio en una sola solicitud. Los diálogos, sonidos de ambiente y música de fondo se sincronizan automáticamente con los visuales, ofreciendo resultados inmersivos sin necesidad de edición adicional.
Adherencia Precisa a las Indicaciones con la API Wan 2.5 Preview
Con la API Wan 2.5 de texto a video, las indicaciones complejas se siguen con mayor precisión. Los ángulos de cámara, las configuraciones de iluminación y la dinámica de las escenas se capturan con mayor exactitud, lo que da a los desarrolladores la confianza de que cada llamada a la API traducirá las instrucciones creativas en resultados de video consistentes.
Adaptación de Estilos Flexibles a Través de la API Wan 2.5
La API Wan 2.5 Preview ofrece una amplia variedad de estilos visuales, desde el realismo cinematográfico hasta el anime o la ilustración. Conserva la identidad de los personajes y la coherencia de las escenas, lo que permiteRe-edición de traducción API a los desarrolladores integrar estéticas versátiles en sus aplicaciones a través de una sola API.
API Multimodal con Opciones de Generación de Video Flexibles
La API Wan 2.5 incluye los endpoints wan2.5-t2v-preview (texto a video) y wan2.5-i2v-preview (imagen a video). Todos los modos son compatibles con varias resoluciones (720p, 1080p), mientras que también están disponibles opciones de relación de aspecto (16:9, 9:16, 1:1) para la generación de video a partir de texto.
API Wan 2.5 vs. Veo 3: ¿Cuál se ajusta mejor a tus necesidades?
Tanto la API Wan 2.5 de Alibaba como el Veo 3 de Google representan lo último en generación de videos con IA, ofreciendo capacidades de texto a video e imagen a video con audio. Pero sus fortalezas no son las mismas. Veo 3 está diseñado para el realismo cinematográfico. En cambio, la API Wan 2.5 se enfoca en la sincronización nativa de audio y video, opciones de salida flexibles y un rendimiento multilingüe más robusto.
| Característica | API Wan 2.5 (Alibaba) | Veo 3 (Google) |
|---|---|---|
| Generation Modes | Text-to-Video (wan2.5-t2v-preview api) & Image-to-Video (wan2.5-i2v-preview api) | Text-to-Video & Image-to-Video |
| Audio & A/V Sync | Native audio-video generation with dialogue, ambient sound, and BGM | Audio available but less integrated; focus remains on visuals |
| Prompt Adherence | Strong fidelity to complex instructions, including camera, lighting, and motion | Excellent realism, but may struggle with highly detailed or abstract prompts |
| Style Adaptation | Cinematic realism, anime, illustration; strong stylization support | Focus on cinematic realism, less flexible for stylized outputs |
| Multilingual Support | Reliable with Chinese & minor languages | Limited; often defaults to “unknown language” in non-English prompts |
| Video Duration | Up to 10 seconds | Up to ~8 seconds |
| Aspect Ratio Options | 16:9, 9:16, 1:1 (T2V) | Primarily cinematic formats; fewer ratio options |
Cómo empezar con la API Wan 2.5 gratuita en Kie.ai
Paso 1: Regístrate o inicia sesión y obtén tu clave de API Wan 2.5
Crea una cuenta en Kie.ai o inicia sesión si ya tienes una. Una vez que estés en el panel de control, genera tu clave de API Wan 2.5. Esta clave segura autenticará tus solicitudes y conectará tu aplicación a los endpoints de Wan 2.5 de Alibaba.
Paso 2: Prueba la API Wan 2.5 de forma gratuita en el Playground
Antes de integrar, prueba el Playground de Kie.ai en la plataforma. Aquí puedes ejecutar la API wan2.5-t2v-preview (texto a video) y wan2.5-i2v-preview (imagen a video) con ejemplos de indicaciones. Este entorno de prueba gratuito te ayuda a experimentar con resoluciones, relaciones de aspecto y resultados de sincronización de audio antes de la implementación.
Paso 3: Implementa la API Wan 2.5 en tu flujo de trabajo
Una vez que estés satisfecho con los resultados, integra la API Wan 2.5 en tu aplicación o proceso de trabajo. Usa la clave de API para llamar a los endpoints directamente, personaliza los resultados con indicaciones y escala la generación de videos para tu proyecto, ya sea contenido corto, campañas de marketing o aplicaciones de narrativa creativa.
Consejos para lograr los mejores resultados con la API Wan 2.5 de Alibaba
Para aprovechar al máximo la API Wan 2.5, es clave crear indicaciones claras, detalladas y estructuradas. El modelo responde mejor cuando las instrucciones visuales y de audio están claramente especificadas. Aquí tienes recomendaciones prácticas:
Escribe diálogos precisos
When adding speech, don’t just request “dialogue.” Instead, provide the exact words to be spoken and specify who says them. This is especially important in multi-character scenes where order and clarity matter. For example: Character A: “We have to keep moving.” Character B: “Not until we find shelter.” By writing dialogue this way, you ensure the API assigns the right lines to the right characters.
Controla el silencio de manera explícita
In some videos, the atmosphere should be driven by visuals or sound effects alone. If you don’t want dialogue, make that clear in your prompt. Adding phrases such as “no dialogue” or “no actors speaking” prevents unintended voices from appearing. This small detail keeps your output aligned with the creative vision.
Define el audio de fondo y la ambientación
Beyond dialogue, ambient sound and music set the emotional tone. Be specific about the kind of environment or soundtrack you want, whether it’s natural or dramatic. Examples include: “soft rain tapping on windows with distant thunder” or “fast-paced action music with heavy percussion.” The clearer you are, the better the model can synchronize visuals with sound to create an immersive result.
Enriquece más las descripciones de escena con detalles
Wan 2.5 excels when prompts include setting, lighting, camera perspective, and mood. Instead of writing “a person walking on a road,” expand the description to capture cinematic elements. For example: A wide shot of a mountain road at sunset, golden light flooding the sky, a cyclist racing downhill, with energetic background music in the background. This depth of description allows the API to produce more natural, dynamic, and visually coherent videos.
¿Por qué elegir Kie.ai para generar vídeos con la API Wan 2.5 Preview?
Precios accesibles para la API Wan 2.5
Accede a la API Wan 2.5 de Alibaba a precios accesibles a través de Kie.ai. Ya sea que utilices el endpoint de texto a video o de imagen a video, nuestros precios hacen que la generación de videos con IA a gran escala sea rentable.
Prueba sin costo de la API Wan 2.5 en el Playground
Prueba wan2.5-t2v-preview y wan2.5-i2v-preview al instante sin coste inicial. El Playground de Kie.ai te permite experimentar con indicaciones, relaciones de aspecto y resoluciones, y previsualizar resultados sincronizados de audio y video antes de la implementación.
Documentación detallada de la API Wan 2.5
Kie.ai ofrece documentación detallada para la API Wan 2.5 de texto a video e imagen a video. Desde la generación de tu clave de API hasta la implementación, nuestras guías incluyen ejemplos claros y mejores prácticas para ayudar a los desarrolladores a integrar rápidamente y con confianza.