阿里云百炼是一站式大模型开发与应用平台,集成通义千问系列及DeepSeek、Kimi等主流第三方模型,覆盖文本生成与理解、多模态交互、专用工具等多种场景,支持多地域与多版本选择。平台提供兼容OpenAI的API及全链路模型服务,同时具备可视化应用构建能力,助力业务人员快速创建智能体、知识库问答等AI应用。新用户可享超7000万tokens限免体验及100余款Agent模板。计费方面,部分模型采用阶梯计价,单价依据输入/输出Token总量确定,支持Batch调用半价及上下文缓存折扣,具体标准可通过百炼控制台查询。

一、阿里云百炼大模型服务平台接入的官网模型分类及列表
1. 通义千问(Qwen)系列模型
核心旗舰模型:
- Qwen-Max:效果最强的模型,适合复杂任务(如多步骤推理、专业分析)。最新版本为Qwen3.6-Max-Preview,在推理能力上全面超越前代。
- Qwen-Plus:平衡性能与成本,适用于多数通用场景(如内容创作、客服问答)。
- Qwen-Flash:高性价比、低延迟模型,适合简单任务(如快速响应、基础对话)。
2025年9月新发布模型:
- Qwen3-Next:基于高稀疏度混合专家(MoE)架构,总参数800亿,激活参数30亿,推理成本显著降低。
- Qwen3-Next-80B-A3B系列:包括Qwen3-Next-80B-A3B-Instruct和Thinking模型,支持高效训练与推理。
- Qwen3-Max-Preview:参数超1万亿,支持256K tokens上下文窗口,覆盖100+语言。
细分领域模型:
- 文本生成:长文本处理、翻译、数据挖掘、法律、意图理解等专用模型。
- 角色扮演(Qwen-Character):支持个性化角色设定与自然对话交互。
2. 多模态模型
- 文本生成与理解:Qwen-VL-Max、Qwen-VL-Plus(支持图像生成与分析)。
- 图像与视频生成:通义万相系列(如图像生成、视频编辑、风格迁移)。
- 语音与音频:语音识别、语音合成、音频内容分析等能力。
3. 第三方开源模型
- DeepSeek:支持多语言对话与代码生成(如DeepSeek 7、DeepSeek 128B)。
- Kimi:专注于多轮对话与复杂任务处理。
- GLM系列:如GLM-130B、GLM-256B等,覆盖文本生成与科学计算场景。
- Llama系列:部分开源模型通过百炼平台提供调用接口(需确认具体地域支持)。
4. 专用工具模型
- Qwen-Embedding:文本向量化模型(如text-embedding-v4),支持语义搜索与相似度计算。
- Qwen-Code系列:如Qwen3-Coder,专为代码理解和生成优化。
- 妙搜(MagicSearch):结合大模型与多源数据检索的问答增强模型,支持深度搜索与跨模态分析。
5. 地域与版本差异
- 主要地域支持:北京(华北2)、新加坡、美国(弗吉尼亚)。
- 北京地域:支持全系列通义模型及第三方模型(如DeepSeek)。
- 国际地域:新加坡、美国支持部分模型,需通过对应地域API入口调用。
重要提醒
- 模型版本迭代:部分模型名称可能随更新调整(如Qwen3-Max-Preview为测试版本,后续可能升级为正式版)。
- 计费差异:旗舰模型(如Qwen-Max)调用成本高于基础模型(如Qwen-Flash),需根据业务需求选择。
- API兼容性:支持OpenAI接口规范,可快速迁移代码(需替换API Key与模型名称)。
二、新人免费额度介绍
当您首次开通阿里云百炼时,平台会自动为您发放各模型的新人专属免费额度。百炼平台提供7000万tokens限免体验,支持100+Agent模板一键复制。通义千问-Image可免费生成100张图像,具备复杂文本渲染能力;Qwen3-Coder支持代码生成与工具调用;通义千问3支持119种语言,每款模型提供100万免费tokens。用户可通过百炼大模型服务平台进入免费体验:https://www.aliyun.com/product/bailian

三、百炼大模型调用计费收费标准
1、阶梯计费规则
百炼部分模型实行阶梯计费。单价取决于单次请求的输入 Token 总量。该请求的所有 Token 均按对应阶梯的单价结算。
例如,某模型设有两档计费区间:0 < Token ≤ 32K 和 32K < Token ≤ 128K。若输入 100K Token,因数值落在第二区间(32K < 100K ≤ 128K),所有 Token 均按第二档单价结算。
2、文本生成-千问
2.1 千问Max
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。
1.中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3.6-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤128K | 9元 | 54元 |
| qwen3.6-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 15元 | 90元 |
| qwen3-max > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 2.5元 | 10元 |
| qwen3-max > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 4元 | 16元 |
| qwen3-max > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 7元 | 28元 |
| qwen3-max-2026-01-23 | 非思考和思考模式 | 0<Token≤32K | 2.5元 | 10元 |
| qwen3-max-2026-01-23 | 非思考和思考模式 | 32K<Token≤128K | 4元 | 16元 |
| qwen3-max-2026-01-23 | 非思考和思考模式 | 128K<Token≤256K | 7元 | 28元 |
| qwen3-max-2025-09-23 | 仅非思考模式 | 0<Token≤32K | 6元 | 24元 |
| qwen3-max-2025-09-23 | 仅非思考模式 | 32K<Token≤128K | 10元 | 40元 |
| qwen3-max-2025-09-23 | 仅非思考模式 | 128K<Token≤256K | 15元 | 60元 |
| qwen3-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 6元 | 24元 |
| qwen3-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 10元 | 40元 |
| qwen3-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 15元 | 60元 |
更多模型
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|---|
| qwen-max > Batch调用半价 | 仅非思考模式 | 无阶梯计价 | 2.4元 | 9.6元 |
| qwen-max-latest > Batch调用半价 | 仅非思考模式 | 无阶梯计价 | 2.4元 | 9.6元 |
| qwen-max-2025-01-25 | 仅非思考模式 | 无阶梯计价 | 2.4元 | 9.6元 |
| qwen-max-2024-09-19 | 仅非思考模式 | 无阶梯计价 | 20元 | 60元 |
| qwen-max-2024-04-28 | 仅非思考模式 | 无阶梯计价 | 40元 | 120元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
说明:全球部署范围下的模型无免费额度。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3-max > 上下文缓存享有折扣 | 仅非思考模式 | 0<Token≤32K | 2.5元 | 10元 |
| qwen3-max > 上下文缓存享有折扣 | 仅非思考模式 | 32K<Token≤128K | 4元 | 16元 |
| qwen3-max > 上下文缓存享有折扣 | 仅非思考模式 | 128K<Token≤256K | 7元 | 28元 |
| qwen3-max-2025-09-23 | 仅非思考模式 | 0<Token≤32K | 6元 | 24元 |
| qwen3-max-2025-09-23 | 仅非思考模式 | 32K<Token≤128K | 10元 | 40元 |
| qwen3-max-2025-09-23 | 仅非思考模式 | 128K<Token≤256K | 15元 | 60元 |
| qwen3-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 6元 | 24元 |
| qwen3-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 10元 | 40元 |
| qwen3-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 15元 | 60元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
说明:国际部署范围下的模型无免费额度。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3.6-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤128K | 9.742元 | 58.455元 |
| qwen3.6-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 14.988元 | 89.93元 |
| qwen3-max > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 8.807元 | 44.035元 |
| qwen3-max > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 17.614元 | 88.071元 |
| qwen3-max > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 22.018元 | 110.089元 |
| qwen3-max-2026-01-23 | 非思考和思考模式 | 0<Token≤32K | 8.807元 | 44.035元 |
| qwen3-max-2026-01-23 | 非思考和思考模式 | 32K<Token≤128K | 17.614元 | 88.071元 |
| qwen3-max-2026-01-23 | 非思考和思考模式 | 128K<Token≤256K | 22.018元 | 110.089元 |
| qwen3-max-2025-09-23 | 仅非思考模式 | 0<Token≤32K | 8.807元 | 44.035元 |
| qwen3-max-2025-09-23 | 仅非思考模式 | 32K<Token≤128K | 17.614元 | 88.071元 |
| qwen3-max-2025-09-23 | 仅非思考模式 | 128K<Token≤256K | 22.018元 | 110.089元 |
| qwen3-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 8.807元 | 44.035元 |
| qwen3-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 17.614元 | 88.071元 |
| qwen3-max-preview > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 22.018元 | 110.089元 |
更多模型
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|---|
| qwen-max > Batch调用半价 | 仅非思考模式 | 无阶梯计价 | 11.743元 | 46.971元 |
| qwen-max-latest | 仅非思考模式 | 无阶梯计价 | 11.743元 | 46.971元 |
| qwen-max-2025-01-25 | 仅非思考模式 | 无阶梯计价 | 11.743元 | 46.971元 |
4. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。
说明:欧盟部署范围下的模型无免费额度。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3-max | 非思考和思考模式 | 0<Token≤32K | 8.993元 | 44.965元 |
| qwen3-max | 非思考和思考模式 | 32K<Token≤128K | 17.986元 | 89.93元 |
| qwen3-max | 非思考和思考模式 | 128K<Token≤256K | 22.483元 | 112.413元 |
| qwen3-max-2026-01-23 | 非思考和思考模式 | 0<Token≤32K | 8.993元 | 44.965元 |
| qwen3-max-2026-01-23 | 非思考和思考模式 | 32K<Token≤128K | 17.986元 | 89.93元 |
| qwen3-max-2026-01-23 | 非思考和思考模式 | 128K<Token≤256K | 22.483元 | 112.413元 |
2.2 千问Plus
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 单次请求的输入Token范围 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答)输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3.6-plus | 0<Token≤256K | 2元 | 12元 | 12元 |
| qwen3.6-plus | 256K<Token≤1M | 8元 | 48元 | 48元 |
| qwen3.6-plus-2026-04-02 | 0<Token≤256K | 2元 | 12元 | 12元 |
| qwen3.6-plus-2026-04-02 | 256K<Token≤1M | 8元 | 48元 | 48元 |
| qwen3.5-plus | 0<Token≤128K | 0.8元 | 4.8元 | 4.8元 |
| qwen3.5-plus | 128K<Token≤256K | 2元 | 12元 | 12元 |
| qwen3.5-plus | 256K<Token≤1M | 4元 | 24元 | 24元 |
| qwen3.5-plus-2026-04-20 | 0<Token≤128K | 0.8元 | 4.8元 | 4.8元 |
| qwen3.5-plus-2026-04-20 | 128K<Token≤256K | 2元 | 12元 | 12元 |
| qwen3.5-plus-2026-04-20 | 256K<Token≤1M | 4元 | 24元 | 24元 |
| qwen3.5-plus-2026-02-15 | 0<Token≤128K | 0.8元 | 4.8元 | 4.8元 |
| qwen3.5-plus-2026-02-15 | 128K<Token≤256K | 2元 | 12元 | 12元 |
| qwen3.5-plus-2026-02-15 | 256K<Token≤1M | 4元 | 24元 | 24元 |
| qwen-plus > Batch调用半价 | 0<Token≤128K | 0.8元 | 2元 | 8元 |
| qwen-plus > Batch调用半价 | 128K<Token≤256K | 2.4元 | 20元 | 24元 |
| qwen-plus > Batch调用半价 | 256K<Token≤1M | 4.8元 | 48元 | 64元 |
| qwen-plus-latest > Batch调用半价 | 0<Token≤128K | 0.8元 | 2元 | 8元 |
| qwen-plus-latest > Batch调用半价 | 128K<Token≤256K | 2.4元 | 20元 | 24元 |
| qwen-plus-latest > Batch调用半价 | 256K<Token≤1M | 4.8元 | 48元 | 64元 |
| qwen-plus-2025-12-01 | 0<Token≤128K | 0.8元 | 2元 | 8元 |
| qwen-plus-2025-12-01 | 128K<Token≤256K | 2.4元 | 20元 | 24元 |
| qwen-plus-2025-12-01 | 256K<Token≤1M | 4.8元 | 48元 | 64元 |
| qwen-plus-2025-09-11 | 0<Token≤128K | 0.8元 | 2元 | 8元 |
| qwen-plus-2025-09-11 | 128K<Token≤256K | 2.4元 | 20元 | 24元 |
| qwen-plus-2025-09-11 | 256K<Token≤1M | 4.8元 | 48元 | 64元 |
| qwen-plus-2025-07-28 | 0<Token≤128K | 0.8元 | 2元 | 8元 |
| qwen-plus-2025-07-28 | 128K<Token≤256K | 2.4元 | 20元 | 24元 |
| qwen-plus-2025-07-28 | 256K<Token≤1M | 4.8元 | 48元 | 64元 |
| qwen-plus-2025-07-14 | 无阶梯计价 | 0.8元 | 2元 | 8元 |
| qwen-plus-2025-04-28 | 无阶梯计价 | 0.8元 | 2元 | 8元 |
更多模型
| 模型名称 | 单次请求的输入Token范围 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| qwen-plus-2025-01-25 | 无阶梯计价 | 0.8元 | 2元 |
| qwen-plus-2025-01-12 | 无阶梯计价 | 0.8元 | 2元 |
| qwen-plus-2024-12-20 | 无阶梯计价 | 0.8元 | 2元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
说明:全球部署范围下的模型无免费额度。
| 模型名称 | 单次请求的输入Token范围 | 输入单价 (每百万Token) | 非思考模式 输出单价 (每百万Token) | 思考模式(思维链+回答)输出单价 (每百万Token) |
|---|---|---|---|---|
| qwen3.6-plus | 0<Token≤256K | 2元 | 12元 | 12元 |
| qwen3.6-plus | 256K<Token≤1M | 8元 | 48元 | 48元 |
| qwen3.6-plus-2026-04-02 | 0<Token≤256K | 2元 | 12元 | 12元 |
| qwen3.6-plus-2026-04-02 | 256K<Token≤1M | 8元 | 48元 | 48元 |
| qwen3.5-plus | 0<Token≤128K | 0.8元 | 4.8元 | 4.8元 |
| qwen3.5-plus | 128K<Token≤256K | 2元 | 12元 | 12元 |
| qwen3.5-plus | 256K<Token≤1M | 4元 | 24元 | 24元 |
| qwen3.5-plus-2026-02-15 | 0<Token≤128K | 0.8元 | 4.8元 | 4.8元 |
| qwen3.5-plus-2026-02-15 | 128K<Token≤256K | 2元 | 12元 | 12元 |
| qwen3.5-plus-2026-02-15 | 256K<Token≤1M | 4元 | 24元 | 24元 |
| qwen-plus | 0<Token≤128K | 0.8元 | 2元 | 8元 |
| qwen-plus | 128K<Token≤256K | 2.4元 | 20元 | 24元 |
| qwen-plus | 256K<Token≤1M | 4.8元 | 48元 | 64元 |
| qwen-plus-2025-12-01 | 0<Token≤128K | 0.8元 | 2元 | 8元 |
| qwen-plus-2025-12-01 | 128K<Token≤256K | 2.4元 | 20元 | 24元 |
| qwen-plus-2025-12-01 | 256K<Token≤1M | 4.8元 | 48元 | 64元 |
| qwen-plus-2025-09-11 | 0<Token≤128K | 0.8元 | 2元 | 8元 |
| qwen-plus-2025-09-11 | 128K<Token≤256K | 2.4元 | 20元 | 24元 |
| qwen-plus-2025-09-11 | 256K<Token≤1M | 4.8元 | 48元 | 64元 |
| qwen-plus-2025-07-28 | 0<Token≤128K | 0.8元 | 2元 | 8元 |
| qwen-plus-2025-07-28 | 128K<Token≤256K | 2.4元 | 20元 | 24元 |
| qwen-plus-2025-07-28 | 256K<Token≤1M | 4.8元 | 48元 | 64元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
说明:国际部署范围下的模型无免费额度。
| 模型名称 | 单次请求的输入Token范围 | 输入单价 (每百万Token) | 非思考模式 输出单价 (每百万Token) | 思考模式(思维链+回答)输出单价 (每百万Token) |
|---|---|---|---|---|
| qwen3.6-plus | 0<Token≤256K | 3.7471元 | 22.4826元 | 22.4826元 |
| qwen3.6-plus | 256K<Token≤1M | 14.9884元 | 44.965元 | 44.965元 |
| qwen3.6-plus-2026-04-02 | 0<Token≤256K | 3.7471元 | 22.4826元 | 22.4826元 |
| qwen3.6-plus-2026-04-02 | 256K<Token≤1M | 14.9884元 | 44.965元 | 44.965元 |
| qwen3.5-plus | 0<Token≤256K | 2.936元 | 17.614元 | 17.614元 |
| qwen3.5-plus | 256K<Token≤1M | 3.67元 | 22.018元 | 22.018元 |
| qwen3.5-plus-2026-04-20 | 0<Token≤256K | 2.936元 | 17.614元 | 17.614元 |
| qwen3.5-plus-2026-04-20 | 256K<Token≤1M | 3.67元 | 22.018元 | 22.018元 |
| qwen3.5-plus-2026-02-15 | 0<Token≤256K | 2.936元 | 17.614元 | 17.614元 |
| qwen3.5-plus-2026-02-15 | 256K<Token≤1M | 3.67元 | 22.018元 | 22.018元 |
| qwen-plus | 0<Token≤256K | 2.936元 | 8.807元 | 29.357元 |
| qwen-plus | 256K<Token≤1M | 8.807元 | 26.421元 | 88.071元 |
| qwen-plus-latest | 0<Token≤256K | 2.936元 | 8.807元 | 29.357元 |
| qwen-plus-latest | 256K<Token≤1M | 8.807元 | 26.421元 | 88.071元 |
| qwen-plus-2025-12-01 | 0<Token≤256K | 2.936元 | 8.807元 | 29.357元 |
| qwen-plus-2025-12-01 | 256K<Token≤1M | 8.807元 | 26.421元 | 88.071元 |
| qwen-plus-2025-09-11 | 0<Token≤256K | 2.936元 | 8.807元 | 29.357元 |
| qwen-plus-2025-09-11 | 256K<Token≤1M | 8.807元 | 26.421元 | 88.071元 |
| qwen-plus-2025-07-28 | 0<Token≤256K | 2.936元 | 8.807元 | 29.357元 |
| qwen-plus-2025-07-28 | 256K<Token≤1M | 8.807元 | 26.421元 | 88.071元 |
| qwen-plus-2025-07-14 | 无阶梯计价 | 2.936元 | 8.807元 | 29.357元 |
| qwen-plus-2025-04-28 | 无阶梯计价 | 2.936元 | 8.807元 | 29.357元 |
4. 美国
服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。
说明:美国部署范围下的模型无免费额度。
| 模型名称 | 单次请求的输入Token范围 | 输入单价 (每百万Token) | 非思考模式 输出单价 (每百万Token) | 思考模式(思维链+回答)输出单价 (每百万Token) |
|---|---|---|---|---|
| qwen-plus-us > 上下文缓存享有折扣 | 0<Token≤256K | 2.936元 | 8.807元 | 29.357元 |
| qwen-plus-us > 上下文缓存享有折扣 | 256K<Token≤1M | 8.807元 | 26.421元 | 88.071元 |
| qwen-plus-2025-12-01-us | 0<Token≤256K | 2.936元 | 8.807元 | 29.357元 |
| qwen-plus-2025-12-01-us | 256K<Token≤1M | 8.807元 | 26.421元 | 88.071元 |
5. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。
说明:欧盟部署范围下的模型无免费额度。
| 模型名称 | 单次请求的输入Token范围 | 输入单价 (每百万Token) | 非思考模式 输出单价 (每百万Token) | 思考模式(思维链+回答)输出单价 (每百万Token) |
|---|---|---|---|---|
| qwen-plus | 0<Token≤256K | 2.998元 | 8.993元 | 29.977元 |
| qwen-plus | 256K<Token≤1M | 8.993元 | 26.979元 | 89.93元 |
| qwen-plus-2025-12-01 | 0<Token≤256K | 2.998元 | 8.993元 | 29.977元 |
| qwen-plus-2025-12-01 | 256K<Token≤1M | 8.993元 | 26.979元 | 89.93元 |
2.3 千问Flash
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3.6-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤256K | 1.2元 | 7.2元 |
| qwen3.6-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 256K<Token≤1M | 4.8元 | 28.8元 |
| qwen3.6-flash-2026-04-16 | 非思考和思考模式 | 0<Token≤256K | 1.2元 | 7.2元 |
| qwen3.6-flash-2026-04-16 | 非思考和思考模式 | 256K<Token≤1M | 4.8元 | 28.8元 |
| qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤128K | 0.2元 | 2元 |
| qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 0.8元 | 8元 |
| qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 256K<Token≤1M | 1.2元 | 12元 |
| qwen3.5-flash-2026-02-23 | 非思考和思考模式 | 0<Token≤128K | 0.2元 | 2元 |
| qwen3.5-flash-2026-02-23 | 非思考和思考模式 | 128K<Token≤256K | 0.8元 | 8元 |
| qwen3.5-flash-2026-02-23 | 非思考和思考模式 | 256K<Token≤1M | 1.2元 | 12元 |
| qwen-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤128K | 0.15元 | 1.5元 |
| qwen-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 0.6元 | 6元 |
| qwen-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 256K<Token≤1M | 1.2元 | 12元 |
| qwen-flash-2025-07-28 | 非思考和思考模式 | 0<Token≤128K | 0.15元 | 1.5元 |
| qwen-flash-2025-07-28 | 非思考和思考模式 | 128K<Token≤256K | 0.6元 | 6元 |
| qwen-flash-2025-07-28 | 非思考和思考模式 | 256K<Token≤1M | 1.2元 | 12元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
说明:全球部署范围下的模型无免费额度。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3.6-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤256K | 1.2元 | 7.2元 |
| qwen3.6-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 256K<Token≤1M | 4.8元 | 28.8元 |
| qwen3.6-flash-2026-04-16 | 非思考和思考模式 | 0<Token≤256K | 1.2元 | 7.2元 |
| qwen3.6-flash-2026-04-16 | 非思考和思考模式 | 256K<Token≤1M | 4.8元 | 28.8元 |
| qwen3.5-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤128K | 0.2元 | 2元 |
| qwen3.5-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 0.8元 | 8元 |
| qwen3.5-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 256K<Token≤1M | 1.2元 | 12元 |
| qwen3.5-flash-2026-02-23 | 非思考和思考模式 | 0<Token≤128K | 0.2元 | 2元 |
| qwen3.5-flash-2026-02-23 | 非思考和思考模式 | 128K<Token≤256K | 0.8元 | 8元 |
| qwen3.5-flash-2026-02-23 | 非思考和思考模式 | 256K<Token≤1M | 1.2元 | 12元 |
| qwen-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤128K | 0.15元 | 1.5元 |
| qwen-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 0.6元 | 6元 |
| qwen-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 256K<Token≤1M | 1.2元 | 12元 |
| qwen-flash-2025-07-28 | 非思考和思考模式 | 0<Token≤128K | 0.15元 | 1.5元 |
| qwen-flash-2025-07-28 | 非思考和思考模式 | 128K<Token≤256K | 0.6元 | 6元 |
| qwen-flash-2025-07-28 | 非思考和思考模式 | 256K<Token≤1M | 1.2元 | 12元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
说明:国际部署范围下的模型无免费额度。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3.6-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤256K | 1.87355元 | 11.2413元 |
| qwen3.6-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 256K<Token≤1M | 7.4942元 | 29.9758元 |
| qwen3.6-flash-2026-04-16 | 非思考和思考模式 | 0<Token≤256K | 1.87355元 | 11.2413元 |
| qwen3.6-flash-2026-04-16 | 非思考和思考模式 | 256K<Token≤1M | 7.4942元 | 29.9758元 |
| qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤1M | 0.734元 | 2.936元 |
| qwen3.5-flash-2026-02-23 | 非思考和思考模式 | 0<Token≤1M | 0.734元 | 2.936元 |
| qwen-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤256K | 0.367元 | 2.936元 |
| qwen-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 256K<Token≤1M | 1.835元 | 14.678元 |
| qwen-flash-2025-07-28 | 非思考和思考模式 | 0<Token≤256K | 0.367元 | 2.936元 |
| qwen-flash-2025-07-28 | 非思考和思考模式 | 256K<Token≤1M | 1.835元 | 14.678元 |
4. 美国
服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。
说明:美国部署范围下的模型无免费额度。
| 模型名称 | 单次请求的输入Token范围 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|---|
| qwen-flash-us > 上下文缓存享有折扣 | 0<Token≤256K | 0.367元 | 2.936元 |
| qwen-flash-us > 上下文缓存享有折扣 | 256K<Token≤1M | 1.835元 | 14.678元 |
| qwen-flash-2025-07-28-us | 0<Token≤256K | 0.367元 | 2.936元 |
| qwen-flash-2025-07-28-us | 256K<Token≤1M | 1.835元 | 14.678元 |
5. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。
说明:欧盟部署范围下的模型无免费额度。
| 模型名称 | 模式 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|
| qwen3.5-flash | 非思考和思考模式 | 0.749元 | 2.998元 |
| qwen3.5-flash-2026-02-23 | 非思考和思考模式 | 0.749元 | 2.998元 |
2.4 千问Turbo
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 模式 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答) 输出单价(每百万Token) |
|---|---|---|---|---|
| qwen-turbo > Batch调用半价 | 非思考和思考模式 | 0.3元 | 0.6元 | 3元 |
| qwen-turbo-latest > Batch调用半价 | 非思考和思考模式 | 0.3元 | 0.6元 | 3元 |
| qwen-turbo-2025-07-15 | 非思考和思考模式 | 0.3元 | 0.6元 | 3元 |
| qwen-turbo-2025-04-28 | 非思考和思考模式 | 0.3元 | 0.6元 | 3元 |
更多模型
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) | 免费额度有效期:百炼开通后90天内 |
|---|---|---|---|
| qwen-turbo-2025-02-11 | 0.3元 | 0.6元 | 100万Token |
| qwen-turbo-2024-11-01 | 0.3元 | 0.6元 | 1000万Token |
2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 模式 | 输入单价 (每百万Token) | 非思考模式 输出单价 (每百万Token) | 思考模式(思维链+回答) 输出单价 (每百万Token) |
|---|---|---|---|---|
| qwen-turbo > Batch调用半价 | 非思考和思考 | 0.367元 | 1.468元 | 3.67元 |
| qwen-turbo-latest | 非思考和思考 | 0.367元 | 1.468元 | 3.67元 |
| qwen-turbo-2025-04-28 | 非思考和思考 | 0.367元 | 1.468元 | 3.67元 |
更多模型
| 模型名称 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|
| qwen-turbo-2024-11-01 | 0.367元 | 1.468元 |
2.5 QwQ
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 模式 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| qwq-plus > Batch调用半价 | 仅思考模式 | 1.6元 | 4元 |
| qwq-plus-latest | 仅思考模式 | 1.6元 | 4元 |
| qwq-plus-2025-03-05 | 仅思考模式 | 1.6元 | 4元 |
2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 模式 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|---|
| qwq-plus | 仅思考模式 | 5.871元 | 17.614元 |
2.6 千问Long
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwen-long > Batch调用半价 | 0.5元 | 2元 |
| qwen-long-latest | 0.5元 | 2元 |
| qwen-long-2025-01-25 | 0.5元 | 2元 |
2.7 千问Omni
计费规则:按输入Token和输出Token计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 文本/图片/视频 输入单价(每百万Token) | 音频 输入单价(每百万Token) | 文本 > 多模态输入 输出单价(每百万Token) | 文本+音频 > 仅音频计费 输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3.5-omni-plus | 7元 | 53元 | 40元 | 213元 |
| qwen3.5-omni-plus-2026-03-15 | 7元 | 53元 | 40元 | 213元 |
| qwen3.5-omni-flash | 2.2元 | 18元 | 13.3元 | 72元 |
| qwen3.5-omni-flash-2026-03-15 | 2.2元 | 18元 | 13.3元 | 72元 |
更多模型
| 模型名称 | 模式 | 文本 输入单价(每百万Token) | 音频 输入单价(每百万Token) | 图片/视频 输入单价(每百万Token) | 文本 > 仅纯文本输入 输出单价(每百万Token) | 文本 > 多模态输入 输出单价(每百万Token) | 文本+音频 > 仅音频计费 输出单价(每百万Token) |
|---|---|---|---|---|---|---|---|
| qwen3-omni-flash | 非思考和思考模式 | 1.8元 | 15.8元 | 3.3元 | 6.9元 | 12.7元 | 62.6元 |
| qwen3-omni-flash-2025-12-01 | 非思考和思考模式 | 1.8元 | 15.8元 | 3.3元 | 6.9元 | 12.7元 | 62.6元 |
| qwen3-omni-flash-2025-09-15 | 非思考和思考模式 | 1.8元 | 15.8元 | 3.3元 | 6.9元 | 12.7元 | 62.6元 |
| qwen-omni-turbo | 非思考模式 | 0.4元 | 25元 | 1.5元 | 1.6元 | 4.5元 | 50元 |
| qwen-omni-turbo-latest | 非思考模式 | 0.4元 | 25元 | 1.5元 | 1.6元 | 4.5元 | 50元 |
| qwen-omni-turbo-2025-03-26 | 非思考模式 | 0.4元 | 25元 | 1.5元 | 1.6元 | 4.5元 | 50元 |
| qwen-omni-turbo-2025-01-19 | 非思考模式 | 0.4元 | 25元 | 1.5元 | 1.6元 | 4.5元 | 50元 |
2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 文本/图片/视频 输入单价(每百万Token) | 音频 输入单价(每百万Token | 文本 > 多模态输入 输出单价(每百万Token) | 文本+音频 > 仅音频计费 输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3.5-omni-plus | 10.49元 | 82.44元 | 62.2元 | 329.74元 |
| qwen3.5-omni-plus-2026-03-15 | 10.49元 | 82.44元 | 62.2元 | 329.74元 |
| qwen3.5-omni-flash | 3元 | 22.48元 | 16.49元 | 89.18元 |
| qwen3.5-omni-flash-2026-03-15 | 3元 | 22.48元 | 16.49元 | 89.18元 |
更多模型
| 模型名称 | 模式 | 文本 输入单价(每百万Token) | 音频 输入单价(每百万Token) | 图片/视频 输入单价(每百万Token) | 文本>仅纯文本输入 输出单价(每百万Token) | 文本 > 多模态输入 输出单价(每百万Token) | 文本+音频 > 仅音频计费 输出单价(每百万Token) |
|---|---|---|---|---|---|---|---|
| qwen3-omni-flash | 非思考和思考模式 | 3.156元 | 27.962元 | 5.725元 | 12.183元 | 22.458元 | 110.896元 |
| qwen3-omni-flash-2025-12-01 | 非思考和思考模式 | 3.156元 | 27.962元 | 5.725元 | 12.183元 | 22.458元 | 110.896元 |
| qwen3-omni-flash-2025-09-15 | 非思考和思考模式 | 3.156元 | 27.962元 | 5.725元 | 12.183元 | 22.458元 | 110.896元 |
| qwen-omni-turbo | 非思考模式 | 0.514元 | 32.586元 | 1.541元 | 1.982元 | 4.624元 | 65.246元 |
| qwen-omni-turbo-latest | 非思考模式 | 0.514元 | 32.586元 | 1.541元 | 1.982元 | 4.624元 | 65.246元 |
| qwen-omni-turbo-2025-03-26 | 非思考模式 | 0.514元 | 32.586元 | 1.541元 | 1.982元 | 4.624元 | 65.246元 |
2.8 千问Omni-Realtime
计费规则:按输入Token和输出Token计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 文本/图片 输入单价(每百万Token) | 音频 输入单价(每百万Token) | 文本 > 多模态输入 输出单价(每百万Token) | 文本+音频 > 仅音频计费 输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3.5-omni-plus-realtime | 10元 | 80元 | 60元 | 300元 |
| qwen3.5-omni-plus-realtime-2026-03-15 | 10元 | 80元 | 60元 | 300元 |
| qwen3.5-omni-flash-realtime | 3.3元 | 27元 | 20元 | 107元 |
| qwen3.5-omni-flash-realtime-2026-03-15 | 3.3元 | 27元 | 20元 | 107元 |
2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 文本/图片 输入单价(每百万Token) | 音频 输入单价(每百万Token) | 文本 > 多模态输入 输出单价(每百万Token) | 文本+音频 > 仅音频计费 输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3.5-omni-plus-realtime | 15.74元 | 123.65元 | 92.93元 | 464.64元 |
| qwen3.5-omni-plus-realtime-2026-03-15 | 15.74元 | 123.65元 | 92.93元 | 464.64元 |
| qwen3.5-omni-flash-realtime | 4.12元 | 33.72元 | 24.73元 | 132.65元 |
| qwen3.5-omni-flash-realtime-2026-03-15 | 4.12元 | 33.72元 | 24.73元 | 132.65元 |
2.9 QVQ
计费规则:按输入Token和输出Token计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qvq-max | 8元 | 32元 |
| qvq-max-latest | 8元 | 32元 |
| qvq-max-2025-05-15 | 8元 | 32元 |
| qvq-max-2025-03-25 | 8元 | 32元 |
| qvq-plus | 2元 | 5元 |
| qvq-plus-latest | 2元 | 5元 |
| qvq-plus-2025-05-15 | 2元 | 5元 |
2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|
| qvq-max | 8.807元 | 35.228元 |
| qvq-max-latest | 8.807元 | 35.228元 |
| qvq-max-2025-03-25 | 8.807元 | 35.228元 |
2.10 千问VL
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 1元 | 10元 |
| qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 1.5元 | 15元 |
| qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 3元 | 30元 |
| qwen3-vl-plus-2025-12-19 | 非思考和思考模式 | 0<Token≤32K | 1元 | 10元 |
| qwen3-vl-plus-2025-12-19 | 非思考和思考模式 | 32K<Token≤128K | 1.5元 | 15元 |
| qwen3-vl-plus-2025-12-19 | 非思考和思考模式 | 128K<Token≤256K | 3元 | 30元 |
| qwen3-vl-plus-2025-09-23 | 非思考和思考模式 | 0<Token≤32K | 1元 | 10元 |
| qwen3-vl-plus-2025-09-23 | 非思考和思考模式 | 32K<Token≤128K | 1.5元 | 15元 |
| qwen3-vl-plus-2025-09-23 | 非思考和思考模式 | 128K<Token≤256K | 3元 | 30元 |
| qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 0.15元 | 1.5元 |
| qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 0.3元 | 3元 |
| qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 0.6元 | 6元 |
| qwen3-vl-flash-2026-01-22 | 非思考和思考模式 | 0<Token≤32K | 0.15元 | 1.5元 |
| qwen3-vl-flash-2026-01-22 | 非思考和思考模式 | 32K<Token≤128K | 0.3元 | 3元 |
| qwen3-vl-flash-2026-01-22 | 非思考和思考模式 | 128K<Token≤256K | 0.6元 | 6元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 0<Token≤32K | 0.15元 | 1.5元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 32K<Token≤128K | 0.3元 | 3元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 128K<Token≤256K | 0.6元 | 6元 |
更多模型
| 模型名称 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| qwen-vl-max > Batch调用半价 > 上下文缓存享有折扣 | 无阶梯计价 | 1.6元 | 4元 |
| qwen-vl-max-latest > Batch调用半价 | 无阶梯计价 | 1.6元 | 4元 |
| qwen-vl-max-2025-08-13 | 无阶梯计价 | 1.6元 | 4元 |
| qwen-vl-max-2025-04-08 | 无阶梯计价 | 3元 | 9元 |
| qwen-vl-max-2025-04-02 | 无阶梯计价 | 3元 | 9元 |
| qwen-vl-max-2025-01-25 | 无阶梯计价 | 3元 | 9元 |
| qwen-vl-max-2024-12-30 | 无阶梯计价 | 3元 | 9元 |
| qwen-vl-max-2024-11-19 | 无阶梯计价 | 3元 | 9元 |
| qwen-vl-plus > Batch调用半价 > 上下文缓存享有折扣 | 无阶梯计价 | 0.8元 | 2元 |
| qwen-vl-plus-latest > Batch调用半价 | 无阶梯计价 | 0.8元 | 2元 |
| qwen-vl-plus-2025-08-15 | 无阶梯计价 | 0.8元 | 2元 |
| qwen-vl-plus-2025-07-10 | 无阶梯计价 | 0.15元 | 1.5元 |
| qwen-vl-plus-2025-05-07 | 无阶梯计价 | 1.5元 | 4.5元 |
| qwen-vl-plus-2025-01-25 | 无阶梯计价 | 1.5元 | 4.5元 |
| qwen-vl-plus-2025-01-02 | 无阶梯计价 | 1.5元 | 4.5元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3-vl-plus > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 1元 | 10元 |
| qwen3-vl-plus > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 1.5元 | 15元 |
| qwen3-vl-plus > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 3元 | 30元 |
| qwen3-vl-plus-2025-09-23 | 非思考和思考模式 | 0<Token≤32K | 1元 | 10元 |
| qwen3-vl-plus-2025-09-23 | 非思考和思考模式 | 32K<Token≤128K | 1.5元 | 15元 |
| qwen3-vl-plus-2025-09-23 | 非思考和思考模式 | 128K<Token≤256K | 3元 | 30元 |
| qwen3-vl-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 0.15元 | 1.5元 |
| qwen3-vl-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 0.3元 | 3元 |
| qwen3-vl-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 0.6元 | 6元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 0<Token≤32K | 0.15元 | 1.5元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 32K<Token≤128K | 0.3元 | 3元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 128K<Token≤256K | 0.6元 | 6元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|---|---|
| qwen3-vl-plus > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 1.468元 | 11.743元 |
| qwen3-vl-plus > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 2.202元 | 17.614元 |
| qwen3-vl-plus > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 4.404元 | 35.228元 |
| qwen3-vl-plus-2025-12-19 | 非思考和思考模式 | 0<Token≤32K | 1.468元 | 11.743元 |
| qwen3-vl-plus-2025-12-19 | 非思考和思考模式 | 32K<Token≤128K | 2.202元 | 17.614元 |
| qwen3-vl-plus-2025-12-19 | 非思考和思考模式 | 128K<Token≤256K | 4.404元 | 35.228元 |
| qwen3-vl-plus-2025-09-23 | 非思考和思考模式 | 0<Token≤32K | 1.468元 | 11.743元 |
| qwen3-vl-plus-2025-09-23 | 非思考和思考模式 | 32K<Token≤128K | 2.202元 | 17.614元 |
| qwen3-vl-plus-2025-09-23 | 非思考和思考模式 | 128K<Token≤256K | 4.404元 | 35.228元 |
| qwen3-vl-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 0.367元 | 2.936元 |
| qwen3-vl-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 0.55元 | 4.404元 |
| qwen3-vl-flash > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 0.881元 | 7.046元 |
| qwen3-vl-flash-2026-01-22 | 非思考和思考模式 | 0<Token≤32K | 0.367元 | 2.936元 |
| qwen3-vl-flash-2026-01-22 | 非思考和思考模式 | 32K<Token≤128K | 0.55元 | 4.404元 |
| qwen3-vl-flash-2026-01-22 | 非思考和思考模式 | 128K<Token≤256K | 0.881元 | 7.046元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 0<Token≤32K | 0.367元 | 2.936元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 32K<Token≤128K | 0.55元 | 4.404元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 128K<Token≤256K | 0.881元 | 7.046元 |
更多模型
| 模型名称 | 单次请求的输入Token数 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|---|
| qwen-vl-max > 上下文缓存享有折扣 | 无阶梯计价 | 5.871元 | 23.486元 |
| qwen-vl-max-latest | 无阶梯计价 | 5.871元 | 23.486元 |
| qwen-vl-max-2025-08-13 | 无阶梯计价 | 5.871元 | 23.486元 |
| qwen-vl-max-2025-04-08 | 无阶梯计价 | 5.871元 | 23.486元 |
| qwen-vl-plus > 上下文缓存享有折扣 | 无阶梯计价 | 1.541元 | 4.624元 |
| qwen-vl-plus-latest | 无阶梯计价 | 1.541元 | 4.624元 |
| qwen-vl-plus-2025-08-15 | 无阶梯计价 | 1.541元 | 4.624元 |
| qwen-vl-plus-2025-05-07 | 无阶梯计价 | 1.541元 | 4.624元 |
| qwen-vl-plus-2025-01-25 | 无阶梯计价 | 1.541元 | 4.624元 |
4. 美国
服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3-vl-flash-us > 上下文缓存享有折扣 | 非思考和思考模式 | 0<Token≤32K | 0.367元 | 2.936元 |
| qwen3-vl-flash-us > 上下文缓存享有折扣 | 非思考和思考模式 | 32K<Token≤128K | 0.55元 | 4.404元 |
| qwen3-vl-flash-us > 上下文缓存享有折扣 | 非思考和思考模式 | 128K<Token≤256K | 0.881元 | 7.046元 |
| qwen3-vl-flash-2025-10-15-us | 非思考和思考模式 | 0<Token≤32K | 0.367元 | 2.936元 |
| qwen3-vl-flash-2025-10-15-us | 非思考和思考模式 | 32K<Token≤128K | 0.55元 | 4.404元 |
| qwen3-vl-flash-2025-10-15-us | 非思考和思考模式 | 128K<Token≤256K | 0.881元 | 7.046元 |
4. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|---|
| qwen3-vl-plus | 非思考和思考模式 | 0<Token≤32K | 1.499元 | 11.991元 |
| qwen3-vl-plus | 非思考和思考模式 | 32K<Token≤128K | 2.248元 | 17.986元 |
| qwen3-vl-plus | 非思考和思考模式 | 128K<Token≤256K | 4.497元 | 35.972元 |
| qwen3-vl-flash | 非思考和思考模式 | 0<Token≤32K | 0.375元 | 2.998元 |
| qwen3-vl-flash | 非思考和思考模式 | 32K<Token≤128K | 0.562元 | 4.497元 |
| qwen3-vl-flash | 非思考和思考模式 | 128K<Token≤256K | 0.899元 | 7.194元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 0<Token≤32K | 0.375元 | 2.998元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 32K<Token≤128K | 0.562元 | 4.497元 |
| qwen3-vl-flash-2025-10-15 | 非思考和思考模式 | 128K<Token≤256K | 0.899元 | 7.194元 |
2.11 千问OCR
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwen-vl-ocr > Batch调用半价 | 0.3元 | 0.5元 |
| qwen-vl-ocr-latest > Batch调用半价 | 0.3元 | 0.5元 |
| qwen-vl-ocr-2025-11-20 | 0.3元 | 0.5元 |
| qwen-vl-ocr-2025-08-28 | 5元 | 5元 |
| qwen-vl-ocr-2025-04-13 | 5元 | 5元 |
| qwen-vl-ocr-2024-10-28 | 5元 | 5元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwen-vl-ocr | 0.3元 | 0.5元 |
| qwen-vl-ocr-2025-11-20 | 0.3元 | 0.5元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwen-vl-ocr | 0.514元 | 1.174元 |
| qwen-vl-ocr-2025-11-20 | 0.514元 | 1.174元 |
2.12 千问Audio
说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。
计费规则:按输入Token和输出Token计费。
音频Token计算规则:每一秒钟的音频对应25个Token。若音频时长不足1秒,则按25个Token计算。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) | 免费额度 |
|---|---|---|---|
| qwen-audio-turbo | 目前仅供免费体验。 | 免费额度用完后不可调用,推荐使用全模态(Qwen-Omni)作为替代模型 | 各10万Token 有效期:阿里云百炼开通后90天内 |
| qwen-audio-turbo-latest | 目前仅供免费体验。 | 免费额度用完后不可调用,推荐使用全模态(Qwen-Omni)作为替代模型 | 各10万Token 有效期:阿里云百炼开通后90天内 |
2.13 千问数学模型
计费规则:按输入Token和输出Token计费。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) | 免费额度 |
|---|---|---|---|
| qwen-math-plus | 4元 | 12元 | 各100万Token 有效期:阿里云百炼开通后90天内 |
| qwen-math-turbo | 2元 | 6元 | 各100万Token 有效期:阿里云百炼开通后90天内 |
2.14 千问Coder
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持上下文缓存,仅输入Token享有折扣。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| qwen3-coder-plus > 上下文缓存享有折扣 | 0<Token≤32K | 4元 | 16元 |
| qwen3-coder-plus > 上下文缓存享有折扣 | 32K<Token≤128K | 6元 | 24元 |
| qwen3-coder-plus > 上下文缓存享有折扣 | 128K<Token≤256K | 10元 | 40元 |
| qwen3-coder-plus > 上下文缓存享有折扣 | 256K<Token≤1M | 20元 | 200元 |
| qwen3-coder-plus-2025-09-23 | 0<Token≤32K | 4元 | 16元 |
| qwen3-coder-plus-2025-09-23 | 32K<Token≤128K | 6元 | 24元 |
| qwen3-coder-plus-2025-09-23 | 128K<Token≤256K | 10元 | 40元 |
| qwen3-coder-plus-2025-09-23 | 256K<Token≤1M | 20元 | 200元 |
| qwen3-coder-plus-2025-07-22 | 0<Token≤32K | 4元 | 16元 |
| qwen3-coder-plus-2025-07-22 | 32K<Token≤128K | 6元 | 24元 |
| qwen3-coder-plus-2025-07-22 | 128K<Token≤256K | 10元 | 40元 |
| qwen3-coder-plus-2025-07-22 | 256K<Token≤1M | 20元 | 200元 |
| qwen3-coder-flash | 0<Token≤32K | 1元 | 4元 |
| qwen3-coder-flash | 32K<Token≤128K | 1.5元 | 6元 |
| qwen3-coder-flash | 128K<Token≤256K | 2.5元 | 10元 |
| qwen3-coder-flash | 256K<Token≤1M | 5元 | 25元 |
| qwen3-coder-flash-2025-07-28 | 0<Token≤32K | 1元 | 4元 |
| qwen3-coder-flash-2025-07-28 | 32K<Token≤128K | 1.5元 | 6元 |
| qwen3-coder-flash-2025-07-28 | 128K<Token≤256K | 2.5元 | 10元 |
| qwen3-coder-flash-2025-07-28 | 256K<Token≤1M | 5元 | 25元 |
更多模型
| 模型名称 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| qwen-coder-plus | 无阶梯计价 | 3.5元 | 7元 |
| qwen-coder-plus-latest | 无阶梯计价 | 3.5元 | 7元 |
| qwen-coder-plus-2024-11-06 | 无阶梯计价 | 3.5元 | 7元 |
| qwen-coder-turbo | 无阶梯计价 | 2元 | 6元 |
| qwen-coder-turbo-latest | 无阶梯计价 | 2元 | 6元 |
| qwen-coder-turbo-2024-09-19 | 无阶梯计价 | 2元 | 6元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 单次请求的输入Token数 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|---|
| qwen3-coder-plus | 0<Token≤32K | 4元 | 16元 |
| qwen3-coder-plus | 32K<Token≤128K | 6元 | 24元 |
| qwen3-coder-plus | 128K<Token≤256K | 10元 | 40元 |
| qwen3-coder-plus | 256K<Token≤1M | 20元 | 200元 |
| qwen3-coder-plus-2025-09-23 | 0<Token≤32K | 4元 | 16元 |
| qwen3-coder-plus-2025-09-23 | 32K<Token≤128K | 6元 | 24元 |
| qwen3-coder-plus-2025-09-23 | 128K<Token≤256K | 10元 | 40元 |
| qwen3-coder-plus-2025-09-23 | 256K<Token≤1M | 20元 | 200元 |
| qwen3-coder-plus-2025-07-22 | 0<Token≤32K | 4元 | 16元 |
| qwen3-coder-plus-2025-07-22 | 32K<Token≤128K | 6元 | 24元 |
| qwen3-coder-plus-2025-07-22 | 128K<Token≤256K | 10元 | 40元 |
| qwen3-coder-plus-2025-07-22 | 256K<Token≤1M | 20元 | 200元 |
| qwen3-coder-flash | 0<Token≤32K | 1元 | 4元 |
| qwen3-coder-flash | 32K<Token≤128K | 1.5元 | 6元 |
| qwen3-coder-flash | 128K<Token≤256K | 2.5元 | 10元 |
| qwen3-coder-flash | 256K<Token≤1M | 5元 | 25元 |
| qwen3-coder-flash-2025-07-28 | 0<Token≤32K | 1元 | 4元 |
| qwen3-coder-flash-2025-07-28 | 32K<Token≤128K | 1.5元 | 6元 |
| qwen3-coder-flash-2025-07-28 | 128K<Token≤256K | 2.5元 | 10元 |
| qwen3-coder-flash-2025-07-28 | 256K<Token≤1M | 5元 | 25元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 单次请求的输入Token数 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|---|
| qwen3-coder-plus | 0<Token≤32K | 7.339元 | 36.696元 |
| qwen3-coder-plus | 32K<Token≤128K | 13.211元 | 66.053元 |
| qwen3-coder-plus | 128K<Token≤256K | 22.018元 | 110.089元 |
| qwen3-coder-plus | 256K<Token≤1M | 44.035元 | 440.354元 |
| qwen3-coder-plus-2025-09-23 | 0<Token≤32K | 7.339元 | 36.696元 |
| qwen3-coder-plus-2025-09-23 | 32K<Token≤128K | 13.211元 | 66.053元 |
| qwen3-coder-plus-2025-09-23 | 128K<Token≤256K | 22.018元 | 110.089元 |
| qwen3-coder-plus-2025-09-23 | 256K<Token≤1M | 44.035元 | 440.354元 |
| qwen3-coder-plus-2025-07-22 | 0<Token≤32K | 7.339元 | 36.696元 |
| qwen3-coder-plus-2025-07-22 | 32K<Token≤128K | 13.211元 | 66.053元 |
| qwen3-coder-plus-2025-07-22 | 128K<Token≤256K | 22.018元 | 110.089元 |
| qwen3-coder-plus-2025-07-22 | 256K<Token≤1M | 44.035元 | 440.354元 |
| qwen3-coder-flash | 0<Token≤32K | 2.202元 | 11.009元 |
| qwen3-coder-flash | 32K<Token≤128K | 3.67元 | 18.348元 |
| qwen3-coder-flash | 128K<Token≤256K | 5.871元 | 29.357元 |
| qwen3-coder-flash | 256K<Token≤1M | 11.743元 | 70.457元 |
| qwen3-coder-flash-2025-07-28 | 0<Token≤32K | 2.202元 | 11.009元 |
| qwen3-coder-flash-2025-07-28 | 32K<Token≤128K | 3.67元 | 18.348元 |
| qwen3-coder-flash-2025-07-28 | 128K<Token≤256K | 5.871元 | 29.357元 |
| qwen3-coder-flash-2025-07-28 | 256K<Token≤1M | 11.743元 | 70.457元 |
2.15 千问翻译模型
计费规则:按输入Token和输出Token计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwen-mt-plus | 1.8元 | 5.4元 |
| qwen-mt-flash | 0.7元 | 1.95元 |
| qwen-mt-lite | 0.6元 | 1.6元 |
| qwen-mt-turbo | 0.7元 | 1.95元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|
| qwen-mt-plus | 1.8元 | 5.4元 |
| qwen-mt-flash | 0.7元 | 1.95元 |
| qwen-mt-lite | 0.6元 | 1.6元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|
| qwen-mt-plus | 18.055元 | 54.09元 |
| qwen-mt-flash | 1.174元 | 3.596元 |
| qwen-mt-lite | 0.881元 | 2.642元 |
| qwen-mt-turbo | 1.174元 | 3.596元 |
4. 美国
服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。
| 模型名称 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|
| qwen-mt-lite-us | 0.881元 | 2.642元 |
2.16 千问数据挖掘模型
说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。
计费规则:按输入Token和输出Token计费。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) | 免费额度 |
|---|---|---|---|
| qwen-doc-turbo | 0.6元 | 1元 | 无免费额度 |
2.17 千问深入研究模型
说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。
计费规则:按输入Token和输出Token计费。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) | 免费额度 |
|---|---|---|---|
| qwen-deep-research | 54元 | 163元 | 无免费额度 |
2.18 通义晓蜜对话分析模型
说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。
计费规则:按输入Token和输出Token计费。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| tongyi-xiaomi-analysis-flash | 0.2元 | 0.4元 |
| tongyi-xiaomi-analysis-pro | 1.0元 | 2.7元 |
3、文本生成-千问-开源版
3.1 Qwen3.6
计费规则:按输入Token和输出Token计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 单次请求的输入Token范围 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答)输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3.6-35b-a3b | 0<Token≤256K | 1.8元 | 10.8元 | 10.8元 |
| qwen3.6-27b | 0<Token≤256K | 3元 | 18元 | 18元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 单次请求的输入Token范围 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答) 输出单价(每百万Token) |
|---|---|---|---|---|
| 非思考模式 | 思考模式(思维链+回答) | |||
| qwen3.6-35b-a3b | 0<Token≤256K | 1.8元 | 10.8元 | 10.8元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 单次请求的输入Token范围 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答)输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3.6-35b-a3b | 0<Token≤256K | 2.810325元 | 16.86195元 | 16.86195元 |
| qwen3.6-27b | 0<Token≤256K | 4.49652元 | 26.97912元 | 26.97912元 |
3.2 Qwen3.5
计费规则:按输入Token和输出Token计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 单次请求的输入Token范围 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答)输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3.5-397b-a17b | 0<Token≤128K | 1.2元 | 7.2元 | 7.2元 |
| qwen3.5-397b-a17b | 128K<Token≤256K | 3元 | 18元 | 18元 |
| qwen3.5-122b-a10b | 0<Token≤128K | 0.8元 | 6.4元 | 6.4元 |
| qwen3.5-122b-a10b | 128K<Token≤256K | 2元 | 16元 | 16元 |
| qwen3.5-27b | 0<Token≤128K | 0.6元 | 4.8元 | 4.8元 |
| qwen3.5-27b | 128K<Token≤256K | 1.8元 | 14.4元 | 14.4元 |
| qwen3.5-35b-a3b | 0<Token≤128K | 0.4元 | 3.2元 | 3.2元 |
| qwen3.5-35b-a3b | 128K<Token≤256K | 1.6元 | 12.8元 | 12.8元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 单次请求的输入Token范围 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答)输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3.5-397b-a17b | 0<Token≤128K | 1.2元 | 7.2元 | 7.2元 |
| qwen3.5-397b-a17b | 128K<Token≤256K | 3元 | 18元 | 18元 |
| qwen3.5-122b-a10b | 0<Token≤128K | 0.8元 | 6.4元 | 6.4元 |
| qwen3.5-122b-a10b | 128K<Token≤256K | 2元 | 16元 | 16元 |
| qwen3.5-27b | 0<Token≤128K | 0.6元 | 4.8元 | 4.8元 |
| qwen3.5-27b | 128K<Token≤256K | 1.8元 | 14.4元 | 14.4元 |
| qwen3.5-35b-a3b | 0<Token≤128K | 0.4元 | 3.2元 | 3.2元 |
| qwen3.5-35b-a3b | 128K<Token≤256K | 1.6元 | 12.8元 | 12.8元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 单次请求的输入Token范围 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答) 输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3.5-397b-a17b | 0<Token≤256K | 4.404元 | 26.421元 | 26.421元 |
| qwen3.5-122b-a10b | 0<Token≤256K | 2.936元 | 23.486元 | 23.486元 |
| qwen3.5-27b | 0<Token≤256K | 2.202元 | 17.614元 | 17.614元 |
| qwen3.5-35b-a3b | 0<Token≤256K | 1.835元 | 14.678元 | 14.678元 |
3.3 Qwen3
计费规则:按输入Token和输出Token计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 模式 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答)输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3-next-80b-a3b-thinking | 仅思考模式 | 1元 | \- | 10元 |
| qwen3-next-80b-a3b-instruct | 仅非思考模式 | 1元 | 4元 | \- |
| qwen3-235b-a22b-thinking-2507 | 仅思考模式 | 2元 | \- | 20元 |
| qwen3-235b-a22b-instruct-2507 | 仅非思考模式 | 2元 | 8元 | \- |
| qwen3-30b-a3b-thinking-2507 | 仅思考模式 | 0.75元 | \- | 7.5元 |
| qwen3-30b-a3b-instruct-2507 | 仅非思考模式 | 0.75元 | 3元 | \- |
| qwen3-235b-a22b | 非思考和思考模式 | 2元 | 8元 | 20元 |
| qwen3-32b | 非思考和思考模式 | 2元 | 8元 | 20元 |
| qwen3-30b-a3b | 非思考和思考模式 | 0.75元 | 3元 | 7.5元 |
| qwen3-14b | 非思考和思考模式 | 1元 | 4元 | 10元 |
| qwen3-8b | 非思考和思考模式 | 0.5元 | 2元 | 5元 |
| qwen3-4b | 非思考和思考模式 | 0.3元 | 1.2元 | 3元 |
| qwen3-1.7b | 非思考和思考模式 | 0.3元 | 1.2元 | 3元 |
| qwen3-0.6b | 非思考和思考模式 | 0.3元 | 1.2元 | 3元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 模式 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答)输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3-next-80b-a3b-thinking | 仅思考模式 | 1元 | \- | 10元 |
| qwen3-next-80b-a3b-instruct | 仅非思考模式 | 1元 | 4元 | \- |
| qwen3-235b-a22b-thinking-2507 | 仅思考模式 | 1.688元 | \- | 16.88元 |
| qwen3-235b-a22b-instruct-2507 | 仅非思考模式 | 1.688元 | 6.752元 | \- |
| qwen3-30b-a3b-thinking-2507 | 仅思考模式 | 0.75元 | \- | 7.5元 |
| qwen3-30b-a3b-instruct-2507 | 仅非思考模式 | 0.75元 | 3元 | \- |
| qwen3-235b-a22b | 非思考和思考模式 | 2元 | 8元 | 20元 |
| qwen3-32b | 非思考和思考模式 | 1.174元 | 4.697元 | 4.697元 |
| qwen3-30b-a3b | 非思考和思考模式 | 0.75元 | 3元 | 7.5元 |
| qwen3-14b | 非思考和思考模式 | 1元 | 4元 | 10元 |
| qwen3-8b | 非思考和思考模式 | 0.5元 | 2元 | 5元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 模式 | 输入单价(每百万Token) | 非思考模式 输出单价(每百万Token) | 思考模式(思维链+回答) 输出单价(每百万Token) |
|---|---|---|---|---|
| qwen3-next-80b-a3b-thinking | 仅思考模式 | 1.101元 | \- | 8.807元 |
| qwen3-next-80b-a3b-instruct | 仅非思考模式 | 1.101元 | 8.807元 | \- |
| qwen3-235b-a22b-thinking-2507 | 仅思考模式 | 1.688元 | \- | 16.88元 |
| qwen3-235b-a22b-instruct-2507 | 仅非思考模式 | 1.688元 | 6.752元 | \- |
| qwen3-30b-a3b-thinking-2507 | 仅思考模式 | 1.468元 | \- | 17.614元 |
| qwen3-30b-a3b-instruct-2507 | 仅非思考模式 | 1.468元 | 5.871元 | \- |
| qwen3-235b-a22b | 非思考和思考模式 | 5.137元 | 20.55元 | 61.65元 |
| qwen3-32b | 非思考和思考模式 | 1.174元 | 4.697元 | 4.697元 |
| qwen3-30b-a3b | 非思考和思考模式 | 1.468元 | 5.871元 | 17.614元 |
| qwen3-14b | 非思考和思考模式 | 2.569元 | 10.275元 | 30.825元 |
| qwen3-8b | 非思考和思考模式 | 1.321元 | 5.137元 | 15.412元 |
| qwen3-4b | 非思考和思考模式 | 0.807元 | 3.082元 | 9.247元 |
| qwen3-1.7b | 非思考和思考模式 | 0.807元 | 3.082元 | 9.247元 |
| qwen3-0.6b | 非思考和思考模式 | 0.807元 | 3.082元 | 9.247元 |
3.4 QwQ-开源版
计费规则:按输入Token和输出Token计费。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwq-32b | 2元 | 6元 |
3.5 QwQ-Preview
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwq-32b-preview > Batch调用半价 | 2元 | 6元 |
3.6 Qwen2.5
计费规则:按输入Token和输出Token计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwen2.5-14b-instruct-1m | 1元 | 3元 |
| qwen2.5-7b-instruct-1m | 0.5元 | 1元 |
| qwen2.5-72b-instruct | 4元 | 12元 |
| qwen2.5-32b-instruct | 2元 | 6元 |
| qwen2.5-14b-instruct | 1元 | 3元 |
| qwen2.5-7b-instruct | 0.5元 | 1元 |
| qwen2.5-3b-instruct | 0.3元 | 0.9元 |
2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
说明:国际(新加坡)模型无免费额度。
| 模型名称 | 输入单价 (每百万Token) | 输出单价 (每百万Token) |
|---|---|---|
| qwen2.5-14b-instruct-1m | 5.908元 | 23.632元 |
| qwen2.5-7b-instruct-1m | 2.701元 | 10.789元 |
| qwen2.5-72b-instruct | 10.275元 | 41.1元 |
| qwen2.5-32b-instruct | 5.137元 | 20.55元 |
| qwen2.5-14b-instruct | 2.569元 | 10.275元 |
| qwen2.5-7b-instruct | 1.284元 | 5.137元 |
3.7 QVQ
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qvq-72b-preview | 12元 | 36元 |
3.8 Qwen-Omni
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 文本 输入单价(每百万Token) | 音频 输入单价(每百万Token) | 图片/视频 输入单价(每百万Token) | 文本 > 仅纯文本输入 输出单价(每百万Token) | 文本 > 多模态输入 输出单价(每百万Token) | 文本+音频 > 仅音频计费 输出单价(每百万Token) |
|---|---|---|---|---|---|---|
| qwen2.5-omni-7b | 0.6元 | 38元 | 2元 | 2.4元 | 6元 | 76元 |
2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 文本 输入单价(每百万Token) | 音频 输入单价(每百万Token) | 图片/视频 输入单价(每百万Token) | 文本 > 仅纯文本输入 输出单价(每百万Token) | 文本 > 多模态输入 输出单价(每百万Token) | 文本+音频 > 仅音频计费 输出单价(每百万Token) |
|---|---|---|---|---|---|---|
| qwen2.5-omni-7b | 0.734元 | 49.613元 | 2.055元 | 2.936元 | 6.165元 | 99.153元 |
3.9 Qwen3-Omni-Captioner
计费规则:按输入Token和输出Token计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwen3-omni-30b-a3b-captioner | 15.8元 | 12.7元 |
2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwen3-omni-30b-a3b-captioner | 27.962元 | 22.458元 |
3.10 Qwen-VL
1.中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 模式 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|
| qwen3-vl-235b-a22b-thinking | 仅思考模式 | 2元 | 20元 |
| qwen3-vl-235b-a22b-instruct | 仅非思考模式 | 2元 | 8元 |
| qwen3-vl-32b-thinking | 仅思考模式 | 2元 | 20元 |
| qwen3-vl-32b-instruct | 仅非思考模式 | 2元 | 8元 |
| qwen3-vl-30b-a3b-thinking | 仅思考模式 | 0.75元 | 7.5元 |
| qwen3-vl-30b-a3b-instruct | 仅非思考模式 | 0.75元 | 3元 |
| qwen3-vl-8b-thinking | 仅思考模式 | 0.5元 | 5元 |
| qwen3-vl-8b-instruct | 仅非思考模式 | 0.5元 | 2元 |
更多模型
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwen2.5-vl-72b-instruct | 16元 | 48元 |
| qwen2.5-vl-32b-instruct | 8元 | 24元 |
| qwen2.5-vl-7b-instruct | 2元 | 5元 |
| qwen2.5-vl-3b-instruct | 1.2元 | 3.6元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 模式 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|
| qwen3-vl-235b-a22b-thinking | 仅思考模式 | 2元 | 20元 |
| qwen3-vl-235b-a22b-instruct | 仅非思考模式 | 2元 | 8元 |
| qwen3-vl-32b-thinking | 仅思考模式 | 1.174元 | 4.697元 |
| qwen3-vl-32b-instruct | 仅非思考模式 | 1.174元 | 4.697元 |
| qwen3-vl-30b-a3b-thinking | 仅思考模式 | 0.75元 | 7.5元 |
| qwen3-vl-30b-a3b-instruct | 仅非思考模式 | 0.75元 | 3元 |
| qwen3-vl-8b-thinking | 仅思考模式 | 0.5元 | 5元 |
| qwen3-vl-8b-instruct | 仅非思考模式 | 0.5元 | 2元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 模式 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|---|
| qwen3-vl-235b-a22b-thinking | 仅思考模式 | 2.936元 | 29.357元 |
| qwen3-vl-235b-a22b-instruct | 仅非思考模式 | 2.936元 | 11.743元 |
| qwen3-vl-32b-thinking | 仅思考模式 | 1.174元 | 4.697元 |
| qwen3-vl-32b-instruct | 仅非思考模式 | 1.174元 | 4.697元 |
| qwen3-vl-30b-a3b-thinking | 仅思考模式 | 1.468元 | 17.614元 |
| qwen3-vl-30b-a3b-instruct | 仅非思考模式 | 1.468元 | 5.871元 |
| qwen3-vl-8b-thinking | 仅思考模式 | 1.321元 | 15.412元 |
| qwen3-vl-8b-instruct | 仅非思考模式 | 1.321元 | 5.137元 |
3.12 Qwen-Math
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|
| qwen2.5-math-72b-instruct | 4元 | 12元 |
| qwen2.5-math-7b-instruct | 1元 | 2元 |
3.13 Qwen-Coder
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| qwen3-coder-next | 0<Token≤32K | 1元 | 4元 |
| qwen3-coder-next | 32K<Token≤128K | 1.5元 | 6元 |
| qwen3-coder-next | 128K<Token≤256K | 2.5元 | 10元 |
| qwen3-coder-480b-a35b-instruct | 0<Token≤32K | 6元 | 24元 |
| qwen3-coder-480b-a35b-instruct | 32K<Token≤128K | 9元 | 36元 |
| qwen3-coder-480b-a35b-instruct | 128K<Token≤200K | 15元 | 60元 |
| qwen3-coder-30b-a3b-instruct | 0<Token≤32K | 1.5元 | 6元 |
| qwen3-coder-30b-a3b-instruct | 32K<Token≤128K | 2.25元 | 9元 |
| qwen3-coder-30b-a3b-instruct | 128K<Token≤200K | 3.75元 | 15元 |
| qwen2.5-coder-32b-instruct | 无阶梯计价 | 2元 | 6元 |
| qwen2.5-coder-14b-instruct | 无阶梯计价 | 2元 | 6元 |
| qwen2.5-coder-7b-instruct | 无阶梯计价 | 1元 | 2元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| qwen3-coder-480b-a35b-instruct | 0<Token≤32K | 6元 | 24元 |
| qwen3-coder-480b-a35b-instruct | 32K<Token≤128K | 9元 | 36元 |
| qwen3-coder-480b-a35b-instruct | 128K<Token≤200K | 15元 | 60元 |
| qwen3-coder-30b-a3b-instruct | 0<Token≤32K | 1.5元 | 6元 |
| qwen3-coder-30b-a3b-instruct | 32K<Token≤128K | 2.25元 | 9元 |
| qwen3-coder-30b-a3b-instruct | 128K<Token≤200K | 3.75元 | 15元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| qwen3-coder-next | 0<Token≤32K | 2.202元 | 11.009元 |
| qwen3-coder-next | 32K<Token≤128K | 3.67元 | 18.348元 |
| qwen3-coder-next | 128K<Token≤256K | 5.871元 | 29.357元 |
| qwen3-coder-480b-a35b-instruct | 0<Token≤32K | 11.009元 | 55.044元 |
| qwen3-coder-480b-a35b-instruct | 32K<Token≤128K | 19.816元 | 99.08元 |
| qwen3-coder-480b-a35b-instruct | 128K<Token≤200K | 33.027元 | 165.133元 |
| qwen3-coder-30b-a3b-instruct | 0<Token≤32K | 3.303元 | 16.513元 |
| qwen3-coder-30b-a3b-instruct | 32K<Token≤128K | 5.504元 | 27.522元 |
| qwen3-coder-30b-a3b-instruct | 128K<Token≤200K | 8.807元 | 44.035元 |
4. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。
| 模型名称 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| qwen3-coder-next | 0<Token≤32K | 2.248元 | 11.241元 |
| qwen3-coder-next | 32K<Token≤128K | 3.747元 | 18.736元 |
| qwen3-coder-next | 128K<Token≤256K | 5.995元 | 29.977元 |
4、文本生成-第三方模型
4.1 DeepSeek
计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|
| deepseek-v4-pro > 上下文缓存享有折扣 | 12元 | 24元 |
| deepseek-v4-flash > 上下文缓存享有折扣 | 1元 | 2元 |
| deepseek-v3.2 > 上下文缓存享有折扣 | 2元 | 3元 |
| deepseek-v3.2-exp | 2元 | 3元 |
| deepseek-v3.1 | 4元 | 12元 |
| deepseek-r1 > Batch调用半价 | 4元 | 16元 |
| deepseek-r1-0528 | 4元 | 16元 |
| deepseek-v3 > Batch调用半价 | 2元 | 8元 |
| deepseek-r1-distill-qwen-1.5b | 限时免费 | 限时免费 |
| deepseek-r1-distill-qwen-7b | 0.5元 | 1元 |
| deepseek-r1-distill-qwen-14b | 1元 | 3元 |
| deepseek-r1-distill-qwen-32b | 2元 | 6元 |
| deepseek-r1-distill-llama-8b | 限时免费 | 限时免费 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|
| deepseek-v4-pro > 上下文缓存享有折扣 | 12元 | 24元 |
| deepseek-v4-flash > 上下文缓存享有折扣 | 1元 | 2元 |
3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|
| deepseek-v3.2 > 上下文缓存享有折扣 | 4.272元 | 12.815元 |
4.2 DeepSeek-硅基流动
说明:服务部署范围仅支持中国内地。
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|
| siliconflow/deepseek-v3.2 | 2元 | 3元 |
| siliconflow/deepseek-v3.1-terminus | 4元 | 12元 |
| siliconflow/deepseek-r1-0528 | 4元 | 16元 |
| siliconflow/deepseek-v3-0324 | 2元 | 8元 |
4.3 DeepSeek-快手万擎
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链+回答 |
|---|---|---|
| vanchin/deepseek-v3.2-think > 上下文缓存享有折扣 | 2元 | 3元 |
| vanchin/deepseek-v3.1-terminus > 上下文缓存享有折扣 | 4元 | 12元 |
| vanchin/deepseek-r1 > 上下文缓存享有折扣 | 4元 | 16元 |
| vanchin/deepseek-v3 > 上下文缓存享有折扣 | 2元 | 8元 |
| vanchin/deepseek-ocr | 0.216元 | 0.216元 |
4.4 Kimi
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 模式 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| kimi-k2.6 | 非思考和思考模式 | 6.5元 | 27元 |
| kimi-k2.5 | 非思考和思考模式 | 4元 | 21元 |
| kimi-k2-thinking | 仅思考模式 | 4元 | 16元 |
| Moonshot-Kimi-K2-Instruct | 非思考模式 | 4元 | 16元 |
2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。
| 模型名称 | 模式 | 输入单价(每百万Token) | 输出单价(每百万Token) |
|---|---|---|---|
| kimi-k2.5 | 非思考和思考模式 | 4元 | 21元 |
4.5 Kimi-月之暗面
| 模型名称 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链和回答 |
|---|---|---|
| kimi/kimi-k2.6 > 上下文缓存享有折扣 | 6.5元 | 27元 |
| kimi/kimi-k2.5 > 上下文缓存享有折扣 | 4元 | 21元 |
4.6 GLM
| 模型名称 | 模式 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链和回答 |
|---|---|---|---|---|
| glm-5.1 | 非思考和思考模式 | 0<Token≤32K | 6元 | 24元 |
| glm-5.1 | 非思考和思考模式 | 32K<Token≤200K | 8元 | 28元 |
| glm-5 | 非思考和思考模式 | 0<Token≤32K | 4元 | 18元 |
| glm-5 | 非思考和思考模式 | 32K<Token≤198K | 6元 | 22元 |
| glm-4.7 | 非思考和思考模式 | 0<Token≤32K | 3元 | 14元 |
| glm-4.7 | 非思考和思考模式 | 32K<Token≤166K | 4元 | 16元 |
| glm-4.6 | 非思考和思考模式 | 0<Token≤32K | 3元 | 14元 |
| glm-4.6 | 非思考和思考模式 | 32K<Token≤166K | 4元 | 16元 |
| glm-4.5 | 非思考和思考模式 | 0<Token≤32K | 3元 | 14元 |
| glm-4.5 | 非思考和思考模式 | 32K<Token≤96K | 4元 | 16元 |
| glm-4.5-air | 非思考和思考模式 | 0<Token≤32K | 0.8元 | 6元 |
| glm-4.5-air | 非思考和思考模式 | 32K<Token≤96K | 1.2元 | 8元 |
4.7 MiniMax
| 模型名称 | 模式 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链和回答 |
|---|---|---|---|
| MiniMax-M2.5 | 仅思考模式 | 2.1元 | 8.4元 |
| MiniMax-M2.1 | 仅思考模式 | 2.1元 | 8.4元 |
4.8 MiniMax-稀宇科技
| 模型名称 | 模式 | 输入单价(每百万Token) | 输出单价(每百万Token) > 思维链和回答 |
|---|---|---|---|
| MiniMax/MiniMax-M2.7 > 上下文缓存享有折扣 | 仅思考模式 | 2.1元 | 8.4元 |
| MiniMax/MiniMax-M2.5 > 上下文缓存享有折扣 | 仅思考模型 | 2.1元 | 8.4元 |
| MiniMax/MiniMax-M2.1 > 上下文缓存享有折扣 | 仅思考模式 | 2.1元 | 8.4元 |
5、图像生成
计费规则:输入不计费,输出计费。输出按成功生成的 图像张数 计费。
计费公式:费用 = 图像单价 × 输出的图像张数。
计费说明:
- 费用与输出图像的分辨率、宽高比无关。
- 请求失败不产生任何费用,也不消耗免费额度。
计费示例:部分图像生成失败
假设图像单价为 0.10元/张。若您调用接口请求生成 4 张图像,但实际仅成功返回 3 张图像的 URL,另 1 张生成失败,系统将仅对成功生成的图像进行计费。
- 计费数量:3 张。
- 费用计算:0.1 × 3 = 0.3元。
5.1 千问文生图
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 输出单价 |
|---|---|
| qwen-image-2.0-pro | 0.5元/张 |
| qwen-image-2.0-pro-2026-04-22 | 0.5元/张 |
| qwen-image-2.0-pro-2026-03-03 | 0.5元/张 |
| qwen-image-2.0 | 0.2元/张 |
| qwen-image-2.0-2026-03-03 | 0.2元/张 |
| qwen-image-max | 0.5元/张 |
| qwen-image-max-2025-12-30 | 0.5元/张 |
| qwen-image-plus | 0.2元/张 |
| qwen-image-plus-2026-01-09 | 0.2元/张 |
| qwen-image | 0.25元/张 |
2. 国际
| 模型名称 | 输出单价 |
|---|---|
| qwen-image-2.0-pro | 0.550443元/张 |
| qwen-image-2.0-pro-2026-04-22 | 0.550443元/张 |
| qwen-image-2.0-pro-2026-03-03 | 0.550443元/张 |
| qwen-image-2.0 | 0.256873元/张 |
| qwen-image-2.0-2026-03-03 | 0.256873元/张 |
| qwen-image-max | 0.550443元/张 |
| qwen-image-max-2025-12-30 | 0.550443元/张 |
| qwen-image-plus | 0.220177元/张 |
| qwen-image-plus-2026-01-09 | 0.220177元/张 |
| qwen-image | 0.256873元/张 |
5.2 千问图像编辑
1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。
| 模型名称 | 输出单价 |
|---|---|
| qwen-image-2.0-pro | 0.5元/张 |
| qwen-image-2.0-pro-2026-04-22 | 0.5元/张 |
| qwen-image-2.0-pro-2026-03-03 | 0.5元/张 |
| qwen-image-2.0 | 0.2元/张 |
| qwen-image-2.0-2026-03-03 | 0.2元/张 |
| qwen-image-edit-max | 0.5元/张 |
| qwen-image-edit-max-2026-01-16 | 0.5元/张 |
| qwen-image-edit-plus | 0.2元/张 |
| qwen-image-edit-plus-2025-12-15 | 0.2元/张 |
| qwen-image-edit-plus-2025-10-30 | 0.2元/张 |
| qwen-image-edit | 0.3元/张 |
2. 国际
| 模型名称 | 输出单价 |
|---|---|
| qwen-image-2.0-pro | 0.550443元/张 |
| qwen-image-2.0-pro-2026-04-22 | 0.550443元/张 |
| qwen-image-2.0-pro-2026-03-03 | 0.550443元/张 |
| qwen-image-2.0 | 0.256873元/张 |
| qwen-image-2.0-2026-03-03 | 0.256873元/张 |
| qwen-image-edit-max | 0.550443元/张 |
| qwen-image-edit-max-2026-01-16 | 0.550443元/张 |
| qwen-image-edit-plus | 0.220177元/张 |
| qwen-image-edit-plus-2025-12-15 | 0.220177元/张 |
| qwen-image-edit-plus-2025-10-30 | 0.220177元/张 |
| qwen-image-edit | 0.330266元/张 |
5.3 千问图像翻译
| 模型名称 | 输出单价 |
|---|---|
| qwen-mt-image | 0.003元/张 |
5.4 Z-Image
1. 中国内地
| 模型名称 | 输出单价 |
|---|---|
| z-image-turbo | 关闭提示词改写(prompt_extend=false):0.1元/张 开启提示词改写(prompt_extend=true):0.2元/张 |
2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。
| 模型名称 | 输出单价 |
|---|---|
| z-image-turbo | 关闭提示词改写(prompt_extend=false):0.110089元/张 开启提示词改写(prompt_extend=true):0.220177元/张 |
5.5 万相文生图
1. 中国内地
| 模型名称 | 输出单价 |
|---|---|
| wan2.6-t2i | 0.20元/张 |
| wan2.5-t2i-preview | 0.20元/张 |
| wan2.2-t2i-plus | 0.20元/张 |
| wan2.2-t2i-flash | 0.14元/张 |
| wanx2.1-t2i-plus | 0.20元/张 |
| wanx2.1-t2i-turbo | 0.14元/张 |
| wanx2.0-t2i-turbo | 0.04元/张 |
| wanx-v1 | 0.16元/张 |
2. 全球
| 模型名称 | 输出单价 |
|---|---|
| wan2.6-t2i | 0.20元/张 |
3. 国际
| 模型名称 | 输出单价 |
|---|---|
| wan2.6-t2i | 0.220177元/张 |
| wan2.5-t2i-preview | 0.220177元/张 |
| wan2.2-t2i-plus | 0.366962元/张 |
| wan2.2-t2i-flash | 0.183481元/张 |
| wan2.1-t2i-plus | 0.366962元/张 |
| wan2.1-t2i-turbo | 0.183481元/张 |
5.6 万相图像生成与编辑
1. 中国内地
| 模型名称 | 输出单价 |
|---|---|
| wan2.7-image-pro | 0.50元/张 |
| wan2.7-image | 0.20元/张 |
| wan2.6-image | 0.20元/张 |
2. 全球
| 模型名称 | 输出单价 |
|---|---|
| wan2.6-image | 0.20元/张 |
3. 国际
| 模型名称 | 输出单价 |
|---|---|
| wan2.7-image-pro | 0.562065元/张 |
| wan2.7-image | 0.220177元/张 |
| wan2.6-image | 0.220177元/张 |
5.7 万相通用图像编辑
1. 中国内地
| 模型名称 | 输出单价 | |
|---|---|---|
| wan2.5-i2i-preview | 0.20元/张 | 50张 |
| wanx2.1-imageedit | 0.14元/张 | 500张 |
2. 国际
| 模型名称 | 输出单价 |
|---|---|
| wan2.5-i2i-preview | 0.220177元/张 |
5.8 万相涂鸦作画
| 模型名称 | 输出单价 |
|---|---|
| wanx-sketch-to-image-lite | 0.06元/张 |
5.9 万相图像局部重绘
| 模型名称 | 输出单价 |
|---|---|
| wanx-x-painting | 目前仅供免费体验。 > 免费额度用完后不可调用 |
5.10 人像风格重绘
| 模型名称 | 输出单价 |
|---|---|
| wanx-style-repaint-v1 | 0.12元/张 |
5.11 图像背景生成
| 模型名称 | 输出单价 |
|---|---|
| wanx-background-generation-v2 | 0.08元/张 |
5.12 图像画面扩展
| 模型名称 | 输出单价 |
|---|---|
| image-out-painting | 0.18元/张 |
5.13 人物实例分割
| 模型名称 | 输出单价 |
|---|---|
| image-instance-segmentation | 目前仅供免费体验。 > 免费额度用完后不可调用。 |
5.14 图像擦除补全
| 模型名称 | 输出单价 |
|---|---|
| image-erase-completion | 目前仅供免费体验。 > 免费额度用完后不可调用 |
5.15 虚拟模特
| 模型名称 | 输出单价 |
|---|---|
| wanx-virtualmodel | 目前仅供免费体验。 > 免费额度用完后不可调用 |
| virtualmodel-v2 |
5.16 鞋靴模特
| 模型名称 | 输出单价 |
|---|---|
| shoemodel-v1 | 目前仅供免费体验。 > 免费额度用完后不可调用。 |
5.17 创意海报生成
| 模型名称 | 输出单价 |
|---|---|
| wanx-poster-generation-v1 | 目前仅供免费体验。 > 免费额度用完后不可调用 |
5.18 人物写真生成-FaceChain
- facechain-facedetect:限时免费。
- facechain-finetune:按训练次数计费,请求失败不计费。
- facechain-generation:输入不计费,输出计费。
| 模型服务 | 模型名称 | 单价 |
|---|---|---|
| 人物图像检测 | facechain-facedetect | 限时免费 |
| 人物形象训练 | facechain-finetune | 2.5元/次 |
| 人物写真生成 | facechain-generation | 0.18元/张 |
5.19 创意文字生成-WordArt锦书
| 模型服务 | 模型名称 | 输出单价 |
|---|---|---|
| 文字纹理生成 | wordart-texture | 0.08元/张 |
| 文字变形 | wordart-semantic | 0.24元/张 |
更多模型调用计费可通过百炼控制台查询。
2026年截至目前,阿里云的AI产品优惠权益还有阿里云百炼 Token Plan,提供多档位套餐,包月预算可控;Qwen3.6 发布,全模型通享 4.5 折;旗舰模型入门首选,适配千行百业 AI 落地;AI 创新场景应用,开箱即用,适配千行百业 AI 落地;阿里云百炼按量达标返券,先用后返,最高返200元;阿里云 JVS Claw 39元起,一键接入 OpenClaw;先进弹性的 AI 算力,高性价比 AI 算力,快速部署千问大模型等其他优惠,详情可通过阿里云权益中心了解:https://www.aliyun.com/benefit

除了AI产品优惠权益之外,云服务器相关活动也是用户非常关心的,在阿里云2026年的活动中,参与活动的云服务器主要有经济型e实例2核2G3M带宽40G ESSD Entry云盘99元1年;通用算力型u1实例2核4G5M带宽80G ESSD云盘企业专享199元1年,轻量云服务器2核2G200M峰值带宽38元一年、2核4G200M峰值带宽9.9元1个月和199元一年,以及通用算力型u2a实例2.5折起,通用算力型u2i实例3折,九代c9i、g9i、r9i等实例1年付6.4折起等其他实例规格的云服务器。更多云产品配置和实时价格可通过阿里云的活动中心:https://t.aliyun.com/U/3vGTeD 查询当前参与活动的云服务器和其他云产品配置的价格信息以及优惠券等信息,如下图所示:

购买之前建议先了解一下当下是否有优惠券或者代金券可以领取,2026年,阿里云官方已经通过云小站平台:https://www.aliyun.com/minisite/goods 推出云产品通用7.5折优惠券,先领券再购买,价格可以在优惠价格基础上额外获得一个7.5折优惠,最高能减12500元。

小结:阿里云百炼作为一站式大模型开发与应用平台,凭借其丰富的模型种类、强大的多模态能力、广泛的第三方开源模型接入以及灵活的调用计费机制,为开发者提供了高效、便捷、经济的AI开发环境。无论是复杂任务处理、通用场景应用,还是专用工具开发,阿里云百炼都能提供针对性的解决方案。同时,新人免费额度政策和详细的计费规则,进一步降低了AI开发的门槛和成本,使得更多企业和开发者能够轻松拥抱AI,推动业务创新与发展。