The text prompt describing the desired video motion
Click to upload or drag and drop
Supported formats: JPEG, PNG, WEBP Maximum file size: 10MB
URL of the image to use as the first frame. Must be publicly accessible
The duration of the generated video in seconds
Video resolution. Valid values: 720p, 1080p
Negative prompt to describe content to avoid
Whether to enable prompt rewriting using LLM
Random seed for reproducibility. If None, a random seed is chosen
Explore different use cases and parameter configurations
The text prompt for video generation. Supports Chinese and English, max 800 characters.
The duration of the generated video in seconds
The aspect ratio of the generated video
Video resolution tier
Negative prompt to describe content to avoid. Max 500 characters.
Whether to enable prompt rewriting using LLM. Improves results for short prompts but increases processing time.
Random seed for reproducibility. If None, a random seed is chosen.
Explore different use cases and parameter configurations
Complete guide to using
阿里巴巴 Wan 2.5 API — 支持音画同步的 AI 视频生成解决方案
无论是文本转视频还是图像转视频,Kie.ai 的 Wan 2.5 API 都能生成电影级画面、实现音画同步并提供多样化输出 —— 成本只是传统方案的一小部分。

阿里巴巴 Wan 2.5 API 全新上线,助力 AI 视频创作
阿里巴巴 Wan 2.5 是前沿的 AI 视频生成模型,能将文字提示和参考图像转化为电影级视频。最初在阿里云 DashScope 平台发布,在视觉真实感、动作表现和音画同步方面展现出强大能力。为便于集成,阿里巴巴推出了 Wan 2.5 API,提供文本转视频(T2V)和图像转视频(I2V)两种预览接口。开发者可借助 wan2.5-t2v-preview 与 wan2.5-i2v-preview,生成支持口型对齐与音频同步的短视频。除了 DashScope,Kie.ai 现已直接提供 Wan 2.5 API 接入,为创作者和开发者带来更灵活、更高性价比的方式,将阿里巴巴的前沿视频技术整合到应用、工作流与创意项目中——成为 Google Veo 3 的强劲替代选择。
Wan 2.5 API 支持的生成方式概览
文本转视频(wan2.5-t2v-preview API)
wan2.5-t2v-preview API 让开发者通过文字提示直接生成视频。通过描述场景、动作与环境,即可输出电影级短片,画面流畅、音画同步——非常适合分镜脚本、营销活动与社交媒体内容。
图像转视频(wan2.5-i2v-preview API)
wan2.5-i2v-preview API 可将静态图像转化为动态短视频。在保留原有风格和人物特征的同时,加入逼真的动画和视角变化,非常适合人像、产品展示和创意叙事。
Wan 2.5 API 的核心优势
原生音频与音画同步无缝衔接
借助 Wan 2.5 API,可在一次请求中同时生成视频与音频。对白、环境音和背景音乐将自动与画面同步,无需额外编辑即可生成沉浸式体验。
Wan 2.5 Preview API 的精准执行指令
使用 Wan 2.5 文本转视频 API,即使是复杂提示词也能精准解析。镜头角度、光线布置和场景动态都能精准呈现,确保每次调用都能将创意指令稳定转化为视频。
Wan 2.5 API 的灵活适应多种风格
Wan 2.5 Preview API 支持多种视觉风格——从电影写实到动漫插画。它既能保持人物特征和场景一致性,又能让开发者通过单一 API 将多样化的美学风格融入应用。
多模式 API,提供灵活的视频生成选项
Wan 2.5 API 提供 wan2.5-t2v-preview(文本转视频)和 wan2.5-i2v-preview(图像转视频)两个端点。所有模式均支持多种分辨率(720p、1080p),其中文本转视频支持多种画幅比例(16:9、9:16、1:1)。
Wan 2.5 API vs. Veo 3:如何选择?
阿里巴巴的 Wan 2.5 API 与谷歌的 Veo 3 都代表了最新的 AI 视频生成技术,支持文本转视频与图像转视频,并且可输出音频。但两者侧重点不同:Veo 3 更偏向电影级写实,而 Wan 2.5 API 则侧重原生音画同步、更灵活的输出选项以及更出色的多语言支持。
| 功能 | Wan 2.5 API(阿里巴巴) | Veo 3(谷歌) |
|---|---|---|
| Generation Modes | Text-to-Video (wan2.5-t2v-preview api) & Image-to-Video (wan2.5-i2v-preview api) | Text-to-Video & Image-to-Video |
| Audio & A/V Sync | Native audio-video generation with dialogue, ambient sound, and BGM | Audio available but less integrated; focus remains on visuals |
| Prompt Adherence | Strong fidelity to complex instructions, including camera, lighting, and motion | Excellent realism, but may struggle with highly detailed or abstract prompts |
| Style Adaptation | Cinematic realism, anime, illustration; strong stylization support | Focus on cinematic realism, less flexible for stylized outputs |
| Multilingual Support | Reliable with Chinese & minor languages | Limited; often defaults to “unknown language” in non-English prompts |
| Video Duration | Up to 10 seconds | Up to ~8 seconds |
| Aspect Ratio Options | 16:9, 9:16, 1:1 (T2V) | Primarily cinematic formats; fewer ratio options |
如何在 Kie.ai 免费开始使用 Wan 2.5 API
步骤一:注册 / 登录并获取你的 Wan 2.5 API Key
在 Kie.ai 上创建账号或登录。登录后,在控制台生成你的 Wan 2.5 API Key。该密钥用于验证请求,并将你的应用连接到阿里巴巴的 Wan 2.5 端点。
步骤二:在 Kie.ai API Playground 免费测试 Wan 2.5 API
在正式接入前,可先在 Kie.ai API Playground 进行免费测试。在这里可使用示例提示测试 wan2.5-t2v-preview(文本转视频)和 wan2.5-i2v-preview(图像转视频),尝试不同分辨率、画幅比例与音画同步设置,以评估输出效果。
步骤三:将 Wan 2.5 API 部署到你的工作流中
满意效果后,就能把 Wan 2.5 API(广域网/云广域网络)集成到应用或工作流里。使用 API Key 直接调用端点,通过提示词定制输出,并按需扩展视频生成——无论是短视频、营销活动还是创意叙事类应用,都适用。
Wan 2.5 API 最佳实践
要充分发挥 Wan 2.5 API 的效果,编写清晰、详细且结构化的提示词至关重要。视觉和音频指令越明确,模型效果越好。以下是一些实用建议:
精准编写对话
When adding speech, don’t just request “dialogue.” Instead, provide the exact words to be spoken and specify who says them. This is especially important in multi-character scenes where order and clarity matter. For example: Character A: “We have to keep moving.” Character B: “Not until we find shelter.” By writing dialogue this way, you ensure the API assigns the right lines to the right characters.
精确控制静音
In some videos, the atmosphere should be driven by visuals or sound effects alone. If you don’t want dialogue, make that clear in your prompt. Adding phrases such as “no dialogue” or “no actors speaking” prevents unintended voices from appearing. This small detail keeps your output aligned with the creative vision.
设置背景音效与氛围
Beyond dialogue, ambient sound and music set the emotional tone. Be specific about the kind of environment or soundtrack you want, whether it’s natural or dramatic. Examples include: “soft rain tapping on windows with distant thunder” or “fast-paced action music with heavy percussion.” The clearer you are, the better the model can synchronize visuals with sound to create an immersive result.
细化场景描述
Wan 2.5 excels when prompts include setting, lighting, camera perspective, and mood. Instead of writing “a person walking on a road,” expand the description to capture cinematic elements. For example: A wide shot of a mountain road at sunset, golden light flooding the sky, a cyclist racing downhill, with energetic background music in the background. This depth of description allows the API to produce more natural, dynamic, and visually coherent videos.
为什么选择 Kie.ai 与 Wan 2.5 Preview API 一起进行 AI 视频生成
Wan 2.5 API 优惠定价
通过 Kie.ai 以更具性价比的价格获取 Wan 2.5 API。无论选择文本转视频还是图像转视频端点,我们的定价都能降低大规模 AI 视频生成的成本。
Playground 免费试用 Wan 2.5 API
马上免费试用 wan2.5-t2v-preview(文本转视频)和 wan2.5-i2v-preview(图像转视频)。在 Kie.ai Playground 中,你可以尝试不同的提示词、画幅比例和分辨率,并在部署前预览音画同步效果。
Wan 2.5 API 完整文档
Kie.ai 为 Wan 2.5 文本转视频 API 和图像转视频 API 提供完整文档。从生成 API Key 到部署,指南包含清晰示例与最佳实践,帮助开发者高效、安全地完成集成。