阿里云百炼大模型服务平台收费价格全解析,阶梯计费更透明!新人福利享不停!

阿里云百炼是一站式大模型开发与应用平台,集成通义千问系列及DeepSeek、Kimi等主流第三方模型,覆盖文本生成与理解、多模态交互、专用工具等多种场景,支持多地域与多版本选择。平台提供兼容OpenAI的API及全链路模型服务,同时具备可视化应用构建能力,助力业务人员快速创建智能体、知识库问答等AI应用。新用户可享超7000万tokens限免体验及100余款Agent模板。计费方面,部分模型采用阶梯计价,单价依据输入/输出Token总量确定,支持Batch调用半价及上下文缓存折扣,具体标准可通过百炼控制台查询。

一、阿里云百炼大模型服务平台接入的官网模型分类及列表

1. 通义千问(Qwen)系列模型

核心旗舰模型:

  • Qwen-Max:效果最强的模型,适合复杂任务(如多步骤推理、专业分析)。最新版本为Qwen3.6-Max-Preview,在推理能力上全面超越前代。
  • Qwen-Plus:平衡性能与成本,适用于多数通用场景(如内容创作、客服问答)。
  • Qwen-Flash:高性价比、低延迟模型,适合简单任务(如快速响应、基础对话)。

2025年9月新发布模型:

  • Qwen3-Next:基于高稀疏度混合专家(MoE)架构,总参数800亿,激活参数30亿,推理成本显著降低。
  • Qwen3-Next-80B-A3B系列:包括Qwen3-Next-80B-A3B-Instruct和Thinking模型,支持高效训练与推理。
  • Qwen3-Max-Preview:参数超1万亿,支持256K tokens上下文窗口,覆盖100+语言。

细分领域模型:

  • 文本生成:长文本处理、翻译、数据挖掘、法律、意图理解等专用模型。
  • 角色扮演(Qwen-Character):支持个性化角色设定与自然对话交互。

2. 多模态模型

  • 文本生成与理解:Qwen-VL-Max、Qwen-VL-Plus(支持图像生成与分析)。
  • 图像与视频生成:通义万相系列(如图像生成、视频编辑、风格迁移)。
  • 语音与音频:语音识别、语音合成、音频内容分析等能力。

3. 第三方开源模型

  • DeepSeek:支持多语言对话与代码生成(如DeepSeek 7、DeepSeek 128B)。
  • Kimi:专注于多轮对话与复杂任务处理。
  • GLM系列:如GLM-130B、GLM-256B等,覆盖文本生成与科学计算场景。
  • Llama系列:部分开源模型通过百炼平台提供调用接口(需确认具体地域支持)。

4. 专用工具模型

  • Qwen-Embedding:文本向量化模型(如text-embedding-v4),支持语义搜索与相似度计算。
  • Qwen-Code系列:如Qwen3-Coder,专为代码理解和生成优化。
  • 妙搜(MagicSearch):结合大模型与多源数据检索的问答增强模型,支持深度搜索与跨模态分析。

5. 地域与版本差异

  • 主要地域支持:北京(华北2)、新加坡、美国(弗吉尼亚)。
    • 北京地域:支持全系列通义模型及第三方模型(如DeepSeek)。
    • 国际地域:新加坡、美国支持部分模型,需通过对应地域API入口调用。

重要提醒

  • 模型版本迭代:部分模型名称可能随更新调整(如Qwen3-Max-Preview为测试版本,后续可能升级为正式版)。
  • 计费差异:旗舰模型(如Qwen-Max)调用成本高于基础模型(如Qwen-Flash),需根据业务需求选择。
  • API兼容性:支持OpenAI接口规范,可快速迁移代码(需替换API Key与模型名称)。

二、新人免费额度介绍

当您首次开通阿里云百炼时,平台会自动为您发放各模型的新人专属免费额度。百炼平台提供7000万tokens限免体验,支持100+Agent模板一键复制。通义千问-Image可免费生成100张图像,具备复杂文本渲染能力;Qwen3-Coder支持代码生成与工具调用;通义千问3支持119种语言,每款模型提供100万免费tokens。用户可通过百炼大模型服务平台进入免费体验:https://www.aliyun.com/product/bailian

三、百炼大模型调用计费收费标准

1、阶梯计费规则

百炼部分模型实行阶梯计费。单价取决于单次请求的输入 Token 总量。该请求的所有 Token 均按对应阶梯的单价结算。

例如,某模型设有两档计费区间:0 < Token ≤ 32K 和 32K < Token ≤ 128K。若输入 100K Token,因数值落在第二区间(32K < 100K ≤ 128K),所有 Token 均按第二档单价结算。

2、文本生成-千问

2.1 千问Max

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。

1.中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3.6-max-preview > 上下文缓存享有折扣非思考和思考模式0<Token≤128K9元54元
qwen3.6-max-preview > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K15元90元
qwen3-max > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式0<Token≤32K2.5元10元
qwen3-max > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K4元16元
qwen3-max > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K7元28元
qwen3-max-2026-01-23非思考和思考模式0<Token≤32K2.5元10元
qwen3-max-2026-01-23非思考和思考模式32K<Token≤128K4元16元
qwen3-max-2026-01-23非思考和思考模式128K<Token≤256K7元28元
qwen3-max-2025-09-23仅非思考模式0<Token≤32K6元24元
qwen3-max-2025-09-23仅非思考模式32K<Token≤128K10元40元
qwen3-max-2025-09-23仅非思考模式128K<Token≤256K15元60元
qwen3-max-preview > 上下文缓存享有折扣非思考和思考模式0<Token≤32K6元24元
qwen3-max-preview > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K10元40元
qwen3-max-preview > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K15元60元

更多模型

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token)
qwen-max > Batch调用半价仅非思考模式无阶梯计价2.4元9.6元
qwen-max-latest > Batch调用半价仅非思考模式无阶梯计价2.4元9.6元
qwen-max-2025-01-25仅非思考模式无阶梯计价2.4元9.6元
qwen-max-2024-09-19仅非思考模式无阶梯计价20元60元
qwen-max-2024-04-28仅非思考模式无阶梯计价40元120元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

说明:全球部署范围下的模型无免费额度。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3-max > 上下文缓存享有折扣仅非思考模式0<Token≤32K2.5元10元
qwen3-max > 上下文缓存享有折扣仅非思考模式32K<Token≤128K4元16元
qwen3-max > 上下文缓存享有折扣仅非思考模式128K<Token≤256K7元28元
qwen3-max-2025-09-23仅非思考模式0<Token≤32K6元24元
qwen3-max-2025-09-23仅非思考模式32K<Token≤128K10元40元
qwen3-max-2025-09-23仅非思考模式128K<Token≤256K15元60元
qwen3-max-preview > 上下文缓存享有折扣非思考和思考模式0<Token≤32K6元24元
qwen3-max-preview > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K10元40元
qwen3-max-preview > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K15元60元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

说明:国际部署范围下的模型无免费额度。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3.6-max-preview > 上下文缓存享有折扣非思考和思考模式0<Token≤128K9.742元58.455元
qwen3.6-max-preview > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K14.988元89.93元
qwen3-max > 上下文缓存享有折扣非思考和思考模式0<Token≤32K8.807元44.035元
qwen3-max > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K17.614元88.071元
qwen3-max > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K22.018元110.089元
qwen3-max-2026-01-23非思考和思考模式0<Token≤32K8.807元44.035元
qwen3-max-2026-01-23非思考和思考模式32K<Token≤128K17.614元88.071元
qwen3-max-2026-01-23非思考和思考模式128K<Token≤256K22.018元110.089元
qwen3-max-2025-09-23仅非思考模式0<Token≤32K8.807元44.035元
qwen3-max-2025-09-23仅非思考模式32K<Token≤128K17.614元88.071元
qwen3-max-2025-09-23仅非思考模式128K<Token≤256K22.018元110.089元
qwen3-max-preview > 上下文缓存享有折扣非思考和思考模式0<Token≤32K8.807元44.035元
qwen3-max-preview > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K17.614元88.071元
qwen3-max-preview > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K22.018元110.089元

更多模型

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token)
qwen-max > Batch调用半价仅非思考模式无阶梯计价11.743元46.971元
qwen-max-latest仅非思考模式无阶梯计价11.743元46.971元
qwen-max-2025-01-25仅非思考模式无阶梯计价11.743元46.971元

4. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。

说明:欧盟部署范围下的模型无免费额度。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3-max非思考和思考模式0<Token≤32K8.993元44.965元
qwen3-max非思考和思考模式32K<Token≤128K17.986元89.93元
qwen3-max非思考和思考模式128K<Token≤256K22.483元112.413元
qwen3-max-2026-01-23非思考和思考模式0<Token≤32K8.993元44.965元
qwen3-max-2026-01-23非思考和思考模式32K<Token≤128K17.986元89.93元
qwen3-max-2026-01-23非思考和思考模式128K<Token≤256K22.483元112.413元

2.2 千问Plus

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称单次请求的输入Token范围输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答)输出单价(每百万Token)
qwen3.6-plus0<Token≤256K2元12元12元
qwen3.6-plus256K<Token≤1M8元48元48元
qwen3.6-plus-2026-04-020<Token≤256K2元12元12元
qwen3.6-plus-2026-04-02256K<Token≤1M8元48元48元
qwen3.5-plus0<Token≤128K0.8元4.8元4.8元
qwen3.5-plus128K<Token≤256K2元12元12元
qwen3.5-plus256K<Token≤1M4元24元24元
qwen3.5-plus-2026-04-200<Token≤128K0.8元4.8元4.8元
qwen3.5-plus-2026-04-20128K<Token≤256K2元12元12元
qwen3.5-plus-2026-04-20256K<Token≤1M4元24元24元
qwen3.5-plus-2026-02-150<Token≤128K0.8元4.8元4.8元
qwen3.5-plus-2026-02-15128K<Token≤256K2元12元12元
qwen3.5-plus-2026-02-15256K<Token≤1M4元24元24元
qwen-plus > Batch调用半价0<Token≤128K0.8元2元8元
qwen-plus > Batch调用半价128K<Token≤256K2.4元20元24元
qwen-plus > Batch调用半价256K<Token≤1M4.8元48元64元
qwen-plus-latest > Batch调用半价0<Token≤128K0.8元2元8元
qwen-plus-latest > Batch调用半价128K<Token≤256K2.4元20元24元
qwen-plus-latest > Batch调用半价256K<Token≤1M4.8元48元64元
qwen-plus-2025-12-010<Token≤128K0.8元2元8元
qwen-plus-2025-12-01128K<Token≤256K2.4元20元24元
qwen-plus-2025-12-01256K<Token≤1M4.8元48元64元
qwen-plus-2025-09-110<Token≤128K0.8元2元8元
qwen-plus-2025-09-11128K<Token≤256K2.4元20元24元
qwen-plus-2025-09-11256K<Token≤1M4.8元48元64元
qwen-plus-2025-07-280<Token≤128K0.8元2元8元
qwen-plus-2025-07-28128K<Token≤256K2.4元20元24元
qwen-plus-2025-07-28256K<Token≤1M4.8元48元64元
qwen-plus-2025-07-14无阶梯计价0.8元2元8元
qwen-plus-2025-04-28无阶梯计价0.8元2元8元

更多模型

模型名称单次请求的输入Token范围输入单价(每百万Token)输出单价(每百万Token)
qwen-plus-2025-01-25无阶梯计价0.8元2元
qwen-plus-2025-01-12无阶梯计价0.8元2元
qwen-plus-2024-12-20无阶梯计价0.8元2元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

说明:全球部署范围下的模型无免费额度。

模型名称单次请求的输入Token范围输入单价 (每百万Token)非思考模式 输出单价 (每百万Token)思考模式(思维链+回答)输出单价 (每百万Token)
qwen3.6-plus0<Token≤256K2元12元12元
qwen3.6-plus256K<Token≤1M8元48元48元
qwen3.6-plus-2026-04-020<Token≤256K2元12元12元
qwen3.6-plus-2026-04-02256K<Token≤1M8元48元48元
qwen3.5-plus0<Token≤128K0.8元4.8元4.8元
qwen3.5-plus128K<Token≤256K2元12元12元
qwen3.5-plus256K<Token≤1M4元24元24元
qwen3.5-plus-2026-02-150<Token≤128K0.8元4.8元4.8元
qwen3.5-plus-2026-02-15128K<Token≤256K2元12元12元
qwen3.5-plus-2026-02-15256K<Token≤1M4元24元24元
qwen-plus0<Token≤128K0.8元2元8元
qwen-plus128K<Token≤256K2.4元20元24元
qwen-plus256K<Token≤1M4.8元48元64元
qwen-plus-2025-12-010<Token≤128K0.8元2元8元
qwen-plus-2025-12-01128K<Token≤256K2.4元20元24元
qwen-plus-2025-12-01256K<Token≤1M4.8元48元64元
qwen-plus-2025-09-110<Token≤128K0.8元2元8元
qwen-plus-2025-09-11128K<Token≤256K2.4元20元24元
qwen-plus-2025-09-11256K<Token≤1M4.8元48元64元
qwen-plus-2025-07-280<Token≤128K0.8元2元8元
qwen-plus-2025-07-28128K<Token≤256K2.4元20元24元
qwen-plus-2025-07-28256K<Token≤1M4.8元48元64元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

说明:国际部署范围下的模型无免费额度。

模型名称单次请求的输入Token范围输入单价 (每百万Token)非思考模式 输出单价 (每百万Token)思考模式(思维链+回答)输出单价 (每百万Token)
qwen3.6-plus0<Token≤256K3.7471元22.4826元22.4826元
qwen3.6-plus256K<Token≤1M14.9884元44.965元44.965元
qwen3.6-plus-2026-04-020<Token≤256K3.7471元22.4826元22.4826元
qwen3.6-plus-2026-04-02256K<Token≤1M14.9884元44.965元44.965元
qwen3.5-plus0<Token≤256K2.936元17.614元17.614元
qwen3.5-plus256K<Token≤1M3.67元22.018元22.018元
qwen3.5-plus-2026-04-200<Token≤256K2.936元17.614元17.614元
qwen3.5-plus-2026-04-20256K<Token≤1M3.67元22.018元22.018元
qwen3.5-plus-2026-02-150<Token≤256K2.936元17.614元17.614元
qwen3.5-plus-2026-02-15256K<Token≤1M3.67元22.018元22.018元
qwen-plus0<Token≤256K2.936元8.807元29.357元
qwen-plus256K<Token≤1M8.807元26.421元88.071元
qwen-plus-latest0<Token≤256K2.936元8.807元29.357元
qwen-plus-latest256K<Token≤1M8.807元26.421元88.071元
qwen-plus-2025-12-010<Token≤256K2.936元8.807元29.357元
qwen-plus-2025-12-01256K<Token≤1M8.807元26.421元88.071元
qwen-plus-2025-09-110<Token≤256K2.936元8.807元29.357元
qwen-plus-2025-09-11256K<Token≤1M8.807元26.421元88.071元
qwen-plus-2025-07-280<Token≤256K2.936元8.807元29.357元
qwen-plus-2025-07-28256K<Token≤1M8.807元26.421元88.071元
qwen-plus-2025-07-14无阶梯计价2.936元8.807元29.357元
qwen-plus-2025-04-28无阶梯计价2.936元8.807元29.357元

4. 美国
服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。

说明:美国部署范围下的模型无免费额度。

模型名称单次请求的输入Token范围输入单价 (每百万Token)非思考模式 输出单价 (每百万Token)思考模式(思维链+回答)输出单价 (每百万Token)
qwen-plus-us > 上下文缓存享有折扣0<Token≤256K2.936元8.807元29.357元
qwen-plus-us > 上下文缓存享有折扣256K<Token≤1M8.807元26.421元88.071元
qwen-plus-2025-12-01-us0<Token≤256K2.936元8.807元29.357元
qwen-plus-2025-12-01-us256K<Token≤1M8.807元26.421元88.071元

5. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。

说明:欧盟部署范围下的模型无免费额度。

模型名称单次请求的输入Token范围输入单价 (每百万Token)非思考模式 输出单价 (每百万Token)思考模式(思维链+回答)输出单价 (每百万Token)
qwen-plus0<Token≤256K2.998元8.993元29.977元
qwen-plus256K<Token≤1M8.993元26.979元89.93元
qwen-plus-2025-12-010<Token≤256K2.998元8.993元29.977元
qwen-plus-2025-12-01256K<Token≤1M8.993元26.979元89.93元

2.3 千问Flash

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3.6-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式0<Token≤256K1.2元7.2元
qwen3.6-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式256K<Token≤1M4.8元28.8元
qwen3.6-flash-2026-04-16非思考和思考模式0<Token≤256K1.2元7.2元
qwen3.6-flash-2026-04-16非思考和思考模式256K<Token≤1M4.8元28.8元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式0<Token≤128K0.2元2元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K0.8元8元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式256K<Token≤1M1.2元12元
qwen3.5-flash-2026-02-23非思考和思考模式0<Token≤128K0.2元2元
qwen3.5-flash-2026-02-23非思考和思考模式128K<Token≤256K0.8元8元
qwen3.5-flash-2026-02-23非思考和思考模式256K<Token≤1M1.2元12元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式0<Token≤128K0.15元1.5元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K0.6元6元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式256K<Token≤1M1.2元12元
qwen-flash-2025-07-28非思考和思考模式0<Token≤128K0.15元1.5元
qwen-flash-2025-07-28非思考和思考模式128K<Token≤256K0.6元6元
qwen-flash-2025-07-28非思考和思考模式256K<Token≤1M1.2元12元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

说明:全球部署范围下的模型无免费额度。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3.6-flash > 上下文缓存享有折扣非思考和思考模式0<Token≤256K1.2元7.2元
qwen3.6-flash > 上下文缓存享有折扣非思考和思考模式256K<Token≤1M4.8元28.8元
qwen3.6-flash-2026-04-16非思考和思考模式0<Token≤256K1.2元7.2元
qwen3.6-flash-2026-04-16非思考和思考模式256K<Token≤1M4.8元28.8元
qwen3.5-flash > 上下文缓存享有折扣非思考和思考模式0<Token≤128K0.2元2元
qwen3.5-flash > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K0.8元8元
qwen3.5-flash > 上下文缓存享有折扣非思考和思考模式256K<Token≤1M1.2元12元
qwen3.5-flash-2026-02-23非思考和思考模式0<Token≤128K0.2元2元
qwen3.5-flash-2026-02-23非思考和思考模式128K<Token≤256K0.8元8元
qwen3.5-flash-2026-02-23非思考和思考模式256K<Token≤1M1.2元12元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式0<Token≤128K0.15元1.5元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K0.6元6元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式256K<Token≤1M1.2元12元
qwen-flash-2025-07-28非思考和思考模式0<Token≤128K0.15元1.5元
qwen-flash-2025-07-28非思考和思考模式128K<Token≤256K0.6元6元
qwen-flash-2025-07-28非思考和思考模式256K<Token≤1M1.2元12元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

说明:国际部署范围下的模型无免费额度。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3.6-flash > 上下文缓存享有折扣非思考和思考模式0<Token≤256K1.87355元11.2413元
qwen3.6-flash > 上下文缓存享有折扣非思考和思考模式256K<Token≤1M7.4942元29.9758元
qwen3.6-flash-2026-04-16非思考和思考模式0<Token≤256K1.87355元11.2413元
qwen3.6-flash-2026-04-16非思考和思考模式256K<Token≤1M7.4942元29.9758元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式0<Token≤1M0.734元2.936元
qwen3.5-flash-2026-02-23非思考和思考模式0<Token≤1M0.734元2.936元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式0<Token≤256K0.367元2.936元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式256K<Token≤1M1.835元14.678元
qwen-flash-2025-07-28非思考和思考模式0<Token≤256K0.367元2.936元
qwen-flash-2025-07-28非思考和思考模式256K<Token≤1M1.835元14.678元

4. 美国
服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。

说明:美国部署范围下的模型无免费额度。

模型名称单次请求的输入Token范围输入单价 (每百万Token)输出单价 (每百万Token)
qwen-flash-us > 上下文缓存享有折扣0<Token≤256K0.367元2.936元
qwen-flash-us > 上下文缓存享有折扣256K<Token≤1M1.835元14.678元
qwen-flash-2025-07-28-us0<Token≤256K0.367元2.936元
qwen-flash-2025-07-28-us256K<Token≤1M1.835元14.678元

5. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。

说明:欧盟部署范围下的模型无免费额度。

模型名称模式输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3.5-flash非思考和思考模式0.749元2.998元
qwen3.5-flash-2026-02-23非思考和思考模式0.749元2.998元

2.4 千问Turbo

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称模式输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答) 输出单价(每百万Token)
qwen-turbo > Batch调用半价非思考和思考模式0.3元0.6元3元
qwen-turbo-latest > Batch调用半价非思考和思考模式0.3元0.6元3元
qwen-turbo-2025-07-15非思考和思考模式0.3元0.6元3元
qwen-turbo-2025-04-28非思考和思考模式0.3元0.6元3元

更多模型

模型名称输入单价(每百万Token)输出单价(每百万Token)免费额度有效期:百炼开通后90天内
qwen-turbo-2025-02-110.3元0.6元100万Token
qwen-turbo-2024-11-010.3元0.6元1000万Token

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称模式输入单价 (每百万Token)非思考模式 输出单价 (每百万Token)思考模式(思维链+回答) 输出单价 (每百万Token)
qwen-turbo > Batch调用半价非思考和思考0.367元1.468元3.67元
qwen-turbo-latest非思考和思考0.367元1.468元3.67元
qwen-turbo-2025-04-28非思考和思考0.367元1.468元3.67元

更多模型

模型名称输入单价 (每百万Token)输出单价 (每百万Token)
qwen-turbo-2024-11-010.367元1.468元

2.5 QwQ

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称模式输入单价(每百万Token)输出单价(每百万Token)
qwq-plus > Batch调用半价仅思考模式1.6元4元
qwq-plus-latest仅思考模式1.6元4元
qwq-plus-2025-03-05仅思考模式1.6元4元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称模式输入单价 (每百万Token)输出单价 (每百万Token)
qwq-plus仅思考模式5.871元17.614元

2.6 千问Long

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwen-long > Batch调用半价0.5元2元
qwen-long-latest0.5元2元
qwen-long-2025-01-250.5元2元

2.7 千问Omni

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称文本/图片/视频 输入单价(每百万Token)音频 输入单价(每百万Token)文本 > 多模态输入 输出单价(每百万Token)文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3.5-omni-plus7元53元40元213元
qwen3.5-omni-plus-2026-03-157元53元40元213元
qwen3.5-omni-flash2.2元18元13.3元72元
qwen3.5-omni-flash-2026-03-152.2元18元13.3元72元

更多模型

模型名称模式文本 输入单价(每百万Token)音频 输入单价(每百万Token)图片/视频 输入单价(每百万Token)文本 > 仅纯文本输入 输出单价(每百万Token)文本 > 多模态输入 输出单价(每百万Token)文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3-omni-flash非思考和思考模式1.8元15.8元3.3元6.9元12.7元62.6元
qwen3-omni-flash-2025-12-01非思考和思考模式1.8元15.8元3.3元6.9元12.7元62.6元
qwen3-omni-flash-2025-09-15非思考和思考模式1.8元15.8元3.3元6.9元12.7元62.6元
qwen-omni-turbo非思考模式0.4元25元1.5元1.6元4.5元50元
qwen-omni-turbo-latest非思考模式0.4元25元1.5元1.6元4.5元50元
qwen-omni-turbo-2025-03-26非思考模式0.4元25元1.5元1.6元4.5元50元
qwen-omni-turbo-2025-01-19非思考模式0.4元25元1.5元1.6元4.5元50元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称文本/图片/视频 输入单价(每百万Token)音频 输入单价(每百万Token文本 > 多模态输入 输出单价(每百万Token)文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3.5-omni-plus10.49元82.44元62.2元329.74元
qwen3.5-omni-plus-2026-03-1510.49元82.44元62.2元329.74元
qwen3.5-omni-flash3元22.48元16.49元89.18元
qwen3.5-omni-flash-2026-03-153元22.48元16.49元89.18元

更多模型

模型名称模式文本 输入单价(每百万Token)音频 输入单价(每百万Token)图片/视频 输入单价(每百万Token)文本>仅纯文本输入 输出单价(每百万Token)文本 > 多模态输入 输出单价(每百万Token)文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3-omni-flash非思考和思考模式3.156元27.962元5.725元12.183元22.458元110.896元
qwen3-omni-flash-2025-12-01非思考和思考模式3.156元27.962元5.725元12.183元22.458元110.896元
qwen3-omni-flash-2025-09-15非思考和思考模式3.156元27.962元5.725元12.183元22.458元110.896元
qwen-omni-turbo非思考模式0.514元32.586元1.541元1.982元4.624元65.246元
qwen-omni-turbo-latest非思考模式0.514元32.586元1.541元1.982元4.624元65.246元
qwen-omni-turbo-2025-03-26非思考模式0.514元32.586元1.541元1.982元4.624元65.246元

2.8 千问Omni-Realtime

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称文本/图片 输入单价(每百万Token)音频 输入单价(每百万Token)文本 > 多模态输入 输出单价(每百万Token)文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3.5-omni-plus-realtime10元80元60元300元
qwen3.5-omni-plus-realtime-2026-03-1510元80元60元300元
qwen3.5-omni-flash-realtime3.3元27元20元107元
qwen3.5-omni-flash-realtime-2026-03-153.3元27元20元107元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称文本/图片 输入单价(每百万Token)音频 输入单价(每百万Token)文本 > 多模态输入 输出单价(每百万Token)文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3.5-omni-plus-realtime15.74元123.65元92.93元464.64元
qwen3.5-omni-plus-realtime-2026-03-1515.74元123.65元92.93元464.64元
qwen3.5-omni-flash-realtime4.12元33.72元24.73元132.65元
qwen3.5-omni-flash-realtime-2026-03-154.12元33.72元24.73元132.65元

2.9 QVQ

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qvq-max8元32元
qvq-max-latest8元32元
qvq-max-2025-05-158元32元
qvq-max-2025-03-258元32元
qvq-plus2元5元
qvq-plus-latest2元5元
qvq-plus-2025-05-152元5元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称输入单价 (每百万Token)输出单价 (每百万Token)
qvq-max8.807元35.228元
qvq-max-latest8.807元35.228元
qvq-max-2025-03-258.807元35.228元

2.10 千问VL

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式0<Token≤32K1元10元
qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K1.5元15元
qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K3元30元
qwen3-vl-plus-2025-12-19非思考和思考模式0<Token≤32K1元10元
qwen3-vl-plus-2025-12-19非思考和思考模式32K<Token≤128K1.5元15元
qwen3-vl-plus-2025-12-19非思考和思考模式128K<Token≤256K3元30元
qwen3-vl-plus-2025-09-23非思考和思考模式0<Token≤32K1元10元
qwen3-vl-plus-2025-09-23非思考和思考模式32K<Token≤128K1.5元15元
qwen3-vl-plus-2025-09-23非思考和思考模式128K<Token≤256K3元30元
qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式0<Token≤32K0.15元1.5元
qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K0.3元3元
qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K0.6元6元
qwen3-vl-flash-2026-01-22非思考和思考模式0<Token≤32K0.15元1.5元
qwen3-vl-flash-2026-01-22非思考和思考模式32K<Token≤128K0.3元3元
qwen3-vl-flash-2026-01-22非思考和思考模式128K<Token≤256K0.6元6元
qwen3-vl-flash-2025-10-15非思考和思考模式0<Token≤32K0.15元1.5元
qwen3-vl-flash-2025-10-15非思考和思考模式32K<Token≤128K0.3元3元
qwen3-vl-flash-2025-10-15非思考和思考模式128K<Token≤256K0.6元6元

更多模型

模型名称单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token)
qwen-vl-max > Batch调用半价 > 上下文缓存享有折扣无阶梯计价1.6元4元
qwen-vl-max-latest > Batch调用半价无阶梯计价1.6元4元
qwen-vl-max-2025-08-13无阶梯计价1.6元4元
qwen-vl-max-2025-04-08无阶梯计价3元9元
qwen-vl-max-2025-04-02无阶梯计价3元9元
qwen-vl-max-2025-01-25无阶梯计价3元9元
qwen-vl-max-2024-12-30无阶梯计价3元9元
qwen-vl-max-2024-11-19无阶梯计价3元9元
qwen-vl-plus > Batch调用半价 > 上下文缓存享有折扣无阶梯计价0.8元2元
qwen-vl-plus-latest > Batch调用半价无阶梯计价0.8元2元
qwen-vl-plus-2025-08-15无阶梯计价0.8元2元
qwen-vl-plus-2025-07-10无阶梯计价0.15元1.5元
qwen-vl-plus-2025-05-07无阶梯计价1.5元4.5元
qwen-vl-plus-2025-01-25无阶梯计价1.5元4.5元
qwen-vl-plus-2025-01-02无阶梯计价1.5元4.5元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3-vl-plus > 上下文缓存享有折扣非思考和思考模式0<Token≤32K1元10元
qwen3-vl-plus > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K1.5元15元
qwen3-vl-plus > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K3元30元
qwen3-vl-plus-2025-09-23非思考和思考模式0<Token≤32K1元10元
qwen3-vl-plus-2025-09-23非思考和思考模式32K<Token≤128K1.5元15元
qwen3-vl-plus-2025-09-23非思考和思考模式128K<Token≤256K3元30元
qwen3-vl-flash > 上下文缓存享有折扣非思考和思考模式0<Token≤32K0.15元1.5元
qwen3-vl-flash > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K0.3元3元
qwen3-vl-flash > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K0.6元6元
qwen3-vl-flash-2025-10-15非思考和思考模式0<Token≤32K0.15元1.5元
qwen3-vl-flash-2025-10-15非思考和思考模式32K<Token≤128K0.3元3元
qwen3-vl-flash-2025-10-15非思考和思考模式128K<Token≤256K0.6元6元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称模式单次请求的输入Token数输入单价 (每百万Token)输出单价 (每百万Token)
qwen3-vl-plus > 上下文缓存享有折扣非思考和思考模式0<Token≤32K1.468元11.743元
qwen3-vl-plus > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K2.202元17.614元
qwen3-vl-plus > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K4.404元35.228元
qwen3-vl-plus-2025-12-19非思考和思考模式0<Token≤32K1.468元11.743元
qwen3-vl-plus-2025-12-19非思考和思考模式32K<Token≤128K2.202元17.614元
qwen3-vl-plus-2025-12-19非思考和思考模式128K<Token≤256K4.404元35.228元
qwen3-vl-plus-2025-09-23非思考和思考模式0<Token≤32K1.468元11.743元
qwen3-vl-plus-2025-09-23非思考和思考模式32K<Token≤128K2.202元17.614元
qwen3-vl-plus-2025-09-23非思考和思考模式128K<Token≤256K4.404元35.228元
qwen3-vl-flash > 上下文缓存享有折扣非思考和思考模式0<Token≤32K0.367元2.936元
qwen3-vl-flash > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K0.55元4.404元
qwen3-vl-flash > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K0.881元7.046元
qwen3-vl-flash-2026-01-22非思考和思考模式0<Token≤32K0.367元2.936元
qwen3-vl-flash-2026-01-22非思考和思考模式32K<Token≤128K0.55元4.404元
qwen3-vl-flash-2026-01-22非思考和思考模式128K<Token≤256K0.881元7.046元
qwen3-vl-flash-2025-10-15非思考和思考模式0<Token≤32K0.367元2.936元
qwen3-vl-flash-2025-10-15非思考和思考模式32K<Token≤128K0.55元4.404元
qwen3-vl-flash-2025-10-15非思考和思考模式128K<Token≤256K0.881元7.046元

更多模型

模型名称单次请求的输入Token数输入单价 (每百万Token)输出单价 (每百万Token)
qwen-vl-max > 上下文缓存享有折扣无阶梯计价5.871元23.486元
qwen-vl-max-latest无阶梯计价5.871元23.486元
qwen-vl-max-2025-08-13无阶梯计价5.871元23.486元
qwen-vl-max-2025-04-08无阶梯计价5.871元23.486元
qwen-vl-plus > 上下文缓存享有折扣无阶梯计价1.541元4.624元
qwen-vl-plus-latest无阶梯计价1.541元4.624元
qwen-vl-plus-2025-08-15无阶梯计价1.541元4.624元
qwen-vl-plus-2025-05-07无阶梯计价1.541元4.624元
qwen-vl-plus-2025-01-25无阶梯计价1.541元4.624元

4. 美国
服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3-vl-flash-us > 上下文缓存享有折扣非思考和思考模式0<Token≤32K0.367元2.936元
qwen3-vl-flash-us > 上下文缓存享有折扣非思考和思考模式32K<Token≤128K0.55元4.404元
qwen3-vl-flash-us > 上下文缓存享有折扣非思考和思考模式128K<Token≤256K0.881元7.046元
qwen3-vl-flash-2025-10-15-us非思考和思考模式0<Token≤32K0.367元2.936元
qwen3-vl-flash-2025-10-15-us非思考和思考模式32K<Token≤128K0.55元4.404元
qwen3-vl-flash-2025-10-15-us非思考和思考模式128K<Token≤256K0.881元7.046元

4. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3-vl-plus非思考和思考模式0<Token≤32K1.499元11.991元
qwen3-vl-plus非思考和思考模式32K<Token≤128K2.248元17.986元
qwen3-vl-plus非思考和思考模式128K<Token≤256K4.497元35.972元
qwen3-vl-flash非思考和思考模式0<Token≤32K0.375元2.998元
qwen3-vl-flash非思考和思考模式32K<Token≤128K0.562元4.497元
qwen3-vl-flash非思考和思考模式128K<Token≤256K0.899元7.194元
qwen3-vl-flash-2025-10-15非思考和思考模式0<Token≤32K0.375元2.998元
qwen3-vl-flash-2025-10-15非思考和思考模式32K<Token≤128K0.562元4.497元
qwen3-vl-flash-2025-10-15非思考和思考模式128K<Token≤256K0.899元7.194元

2.11 千问OCR

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwen-vl-ocr > Batch调用半价0.3元0.5元
qwen-vl-ocr-latest > Batch调用半价0.3元0.5元
qwen-vl-ocr-2025-11-200.3元0.5元
qwen-vl-ocr-2025-08-285元5元
qwen-vl-ocr-2025-04-135元5元
qwen-vl-ocr-2024-10-285元5元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwen-vl-ocr0.3元0.5元
qwen-vl-ocr-2025-11-200.3元0.5元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwen-vl-ocr0.514元1.174元
qwen-vl-ocr-2025-11-200.514元1.174元

2.12 千问Audio

说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。
计费规则:按输入Token和输出Token计费。
音频Token计算规则:每一秒钟的音频对应25个Token。若音频时长不足1秒,则按25个Token计算。

模型名称输入单价(每百万Token)输出单价(每百万Token)免费额度
qwen-audio-turbo目前仅供免费体验。免费额度用完后不可调用,推荐使用全模态(Qwen-Omni)作为替代模型各10万Token 有效期:阿里云百炼开通后90天内
qwen-audio-turbo-latest目前仅供免费体验。免费额度用完后不可调用,推荐使用全模态(Qwen-Omni)作为替代模型各10万Token 有效期:阿里云百炼开通后90天内

2.13 千问数学模型

计费规则:按输入Token和输出Token计费。

模型名称输入单价(每百万Token)输出单价(每百万Token)免费额度
qwen-math-plus4元12元各100万Token 有效期:阿里云百炼开通后90天内
qwen-math-turbo2元6元各100万Token 有效期:阿里云百炼开通后90天内

2.14 千问Coder

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持上下文缓存,仅输入Token享有折扣。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token)
qwen3-coder-plus > 上下文缓存享有折扣0<Token≤32K4元16元
qwen3-coder-plus > 上下文缓存享有折扣32K<Token≤128K6元24元
qwen3-coder-plus > 上下文缓存享有折扣128K<Token≤256K10元40元
qwen3-coder-plus > 上下文缓存享有折扣256K<Token≤1M20元200元
qwen3-coder-plus-2025-09-230<Token≤32K4元16元
qwen3-coder-plus-2025-09-2332K<Token≤128K6元24元
qwen3-coder-plus-2025-09-23128K<Token≤256K10元40元
qwen3-coder-plus-2025-09-23256K<Token≤1M20元200元
qwen3-coder-plus-2025-07-220<Token≤32K4元16元
qwen3-coder-plus-2025-07-2232K<Token≤128K6元24元
qwen3-coder-plus-2025-07-22128K<Token≤256K10元40元
qwen3-coder-plus-2025-07-22256K<Token≤1M20元200元
qwen3-coder-flash0<Token≤32K1元4元
qwen3-coder-flash32K<Token≤128K1.5元6元
qwen3-coder-flash128K<Token≤256K2.5元10元
qwen3-coder-flash256K<Token≤1M5元25元
qwen3-coder-flash-2025-07-280<Token≤32K1元4元
qwen3-coder-flash-2025-07-2832K<Token≤128K1.5元6元
qwen3-coder-flash-2025-07-28128K<Token≤256K2.5元10元
qwen3-coder-flash-2025-07-28256K<Token≤1M5元25元

更多模型

模型名称单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token)
qwen-coder-plus无阶梯计价3.5元7元
qwen-coder-plus-latest无阶梯计价3.5元7元
qwen-coder-plus-2024-11-06无阶梯计价3.5元7元
qwen-coder-turbo无阶梯计价2元6元
qwen-coder-turbo-latest无阶梯计价2元6元
qwen-coder-turbo-2024-09-19无阶梯计价2元6元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称单次请求的输入Token数输入单价 (每百万Token)输出单价 (每百万Token)
qwen3-coder-plus0<Token≤32K4元16元
qwen3-coder-plus32K<Token≤128K6元24元
qwen3-coder-plus128K<Token≤256K10元40元
qwen3-coder-plus256K<Token≤1M20元200元
qwen3-coder-plus-2025-09-230<Token≤32K4元16元
qwen3-coder-plus-2025-09-2332K<Token≤128K6元24元
qwen3-coder-plus-2025-09-23128K<Token≤256K10元40元
qwen3-coder-plus-2025-09-23256K<Token≤1M20元200元
qwen3-coder-plus-2025-07-220<Token≤32K4元16元
qwen3-coder-plus-2025-07-2232K<Token≤128K6元24元
qwen3-coder-plus-2025-07-22128K<Token≤256K10元40元
qwen3-coder-plus-2025-07-22256K<Token≤1M20元200元
qwen3-coder-flash0<Token≤32K1元4元
qwen3-coder-flash32K<Token≤128K1.5元6元
qwen3-coder-flash128K<Token≤256K2.5元10元
qwen3-coder-flash256K<Token≤1M5元25元
qwen3-coder-flash-2025-07-280<Token≤32K1元4元
qwen3-coder-flash-2025-07-2832K<Token≤128K1.5元6元
qwen3-coder-flash-2025-07-28128K<Token≤256K2.5元10元
qwen3-coder-flash-2025-07-28256K<Token≤1M5元25元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称单次请求的输入Token数输入单价 (每百万Token)输出单价 (每百万Token)
qwen3-coder-plus0<Token≤32K7.339元36.696元
qwen3-coder-plus32K<Token≤128K13.211元66.053元
qwen3-coder-plus128K<Token≤256K22.018元110.089元
qwen3-coder-plus256K<Token≤1M44.035元440.354元
qwen3-coder-plus-2025-09-230<Token≤32K7.339元36.696元
qwen3-coder-plus-2025-09-2332K<Token≤128K13.211元66.053元
qwen3-coder-plus-2025-09-23128K<Token≤256K22.018元110.089元
qwen3-coder-plus-2025-09-23256K<Token≤1M44.035元440.354元
qwen3-coder-plus-2025-07-220<Token≤32K7.339元36.696元
qwen3-coder-plus-2025-07-2232K<Token≤128K13.211元66.053元
qwen3-coder-plus-2025-07-22128K<Token≤256K22.018元110.089元
qwen3-coder-plus-2025-07-22256K<Token≤1M44.035元440.354元
qwen3-coder-flash0<Token≤32K2.202元11.009元
qwen3-coder-flash32K<Token≤128K3.67元18.348元
qwen3-coder-flash128K<Token≤256K5.871元29.357元
qwen3-coder-flash256K<Token≤1M11.743元70.457元
qwen3-coder-flash-2025-07-280<Token≤32K2.202元11.009元
qwen3-coder-flash-2025-07-2832K<Token≤128K3.67元18.348元
qwen3-coder-flash-2025-07-28128K<Token≤256K5.871元29.357元
qwen3-coder-flash-2025-07-28256K<Token≤1M11.743元70.457元

2.15 千问翻译模型

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwen-mt-plus1.8元5.4元
qwen-mt-flash0.7元1.95元
qwen-mt-lite0.6元1.6元
qwen-mt-turbo0.7元1.95元

2. 全球

服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称输入单价 (每百万Token)输出单价 (每百万Token)
qwen-mt-plus1.8元5.4元
qwen-mt-flash0.7元1.95元
qwen-mt-lite0.6元1.6元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称输入单价 (每百万Token)输出单价 (每百万Token)
qwen-mt-plus18.055元54.09元
qwen-mt-flash1.174元3.596元
qwen-mt-lite0.881元2.642元
qwen-mt-turbo1.174元3.596元

4. 美国

服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。

模型名称输入单价 (每百万Token)输出单价 (每百万Token)
qwen-mt-lite-us0.881元2.642元

2.16 千问数据挖掘模型

说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称输入单价(每百万Token)输出单价(每百万Token)免费额度
qwen-doc-turbo0.6元1元无免费额度

2.17 千问深入研究模型

说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称输入单价(每百万Token)输出单价(每百万Token)免费额度
qwen-deep-research54元163元无免费额度

2.18 通义晓蜜对话分析模型

说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称输入单价(每百万Token)输出单价(每百万Token)
tongyi-xiaomi-analysis-flash0.2元0.4元
tongyi-xiaomi-analysis-pro1.0元2.7元

3、文本生成-千问-开源版

3.1 Qwen3.6

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称单次请求的输入Token范围输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答)输出单价(每百万Token)
qwen3.6-35b-a3b0<Token≤256K1.8元10.8元10.8元
qwen3.6-27b0<Token≤256K3元18元18元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称单次请求的输入Token范围输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答) 输出单价(每百万Token)
非思考模式思考模式(思维链+回答)
qwen3.6-35b-a3b0<Token≤256K1.8元10.8元10.8元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称单次请求的输入Token范围输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答)输出单价(每百万Token)
qwen3.6-35b-a3b0<Token≤256K2.810325元16.86195元16.86195元
qwen3.6-27b0<Token≤256K4.49652元26.97912元26.97912元

3.2 Qwen3.5

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称单次请求的输入Token范围输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答)输出单价(每百万Token)
qwen3.5-397b-a17b0<Token≤128K1.2元7.2元7.2元
qwen3.5-397b-a17b128K<Token≤256K3元18元18元
qwen3.5-122b-a10b0<Token≤128K0.8元6.4元6.4元
qwen3.5-122b-a10b128K<Token≤256K2元16元16元
qwen3.5-27b0<Token≤128K0.6元4.8元4.8元
qwen3.5-27b128K<Token≤256K1.8元14.4元14.4元
qwen3.5-35b-a3b0<Token≤128K0.4元3.2元3.2元
qwen3.5-35b-a3b128K<Token≤256K1.6元12.8元12.8元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称单次请求的输入Token范围输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答)输出单价(每百万Token)
qwen3.5-397b-a17b0<Token≤128K1.2元7.2元7.2元
qwen3.5-397b-a17b128K<Token≤256K3元18元18元
qwen3.5-122b-a10b0<Token≤128K0.8元6.4元6.4元
qwen3.5-122b-a10b128K<Token≤256K2元16元16元
qwen3.5-27b0<Token≤128K0.6元4.8元4.8元
qwen3.5-27b128K<Token≤256K1.8元14.4元14.4元
qwen3.5-35b-a3b0<Token≤128K0.4元3.2元3.2元
qwen3.5-35b-a3b128K<Token≤256K1.6元12.8元12.8元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称单次请求的输入Token范围输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答) 输出单价(每百万Token)
qwen3.5-397b-a17b0<Token≤256K4.404元26.421元26.421元
qwen3.5-122b-a10b0<Token≤256K2.936元23.486元23.486元
qwen3.5-27b0<Token≤256K2.202元17.614元17.614元
qwen3.5-35b-a3b0<Token≤256K1.835元14.678元14.678元

3.3 Qwen3

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称模式输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答)输出单价(每百万Token)
qwen3-next-80b-a3b-thinking仅思考模式1元\-10元
qwen3-next-80b-a3b-instruct仅非思考模式1元4元\-
qwen3-235b-a22b-thinking-2507仅思考模式2元\-20元
qwen3-235b-a22b-instruct-2507仅非思考模式2元8元\-
qwen3-30b-a3b-thinking-2507仅思考模式0.75元\-7.5元
qwen3-30b-a3b-instruct-2507仅非思考模式0.75元3元\-
qwen3-235b-a22b非思考和思考模式2元8元20元
qwen3-32b非思考和思考模式2元8元20元
qwen3-30b-a3b非思考和思考模式0.75元3元7.5元
qwen3-14b非思考和思考模式1元4元10元
qwen3-8b非思考和思考模式0.5元2元5元
qwen3-4b非思考和思考模式0.3元1.2元3元
qwen3-1.7b非思考和思考模式0.3元1.2元3元
qwen3-0.6b非思考和思考模式0.3元1.2元3元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称模式输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答)输出单价(每百万Token)
qwen3-next-80b-a3b-thinking仅思考模式1元\-10元
qwen3-next-80b-a3b-instruct仅非思考模式1元4元\-
qwen3-235b-a22b-thinking-2507仅思考模式1.688元\-16.88元
qwen3-235b-a22b-instruct-2507仅非思考模式1.688元6.752元\-
qwen3-30b-a3b-thinking-2507仅思考模式0.75元\-7.5元
qwen3-30b-a3b-instruct-2507仅非思考模式0.75元3元\-
qwen3-235b-a22b非思考和思考模式2元8元20元
qwen3-32b非思考和思考模式1.174元4.697元4.697元
qwen3-30b-a3b非思考和思考模式0.75元3元7.5元
qwen3-14b非思考和思考模式1元4元10元
qwen3-8b非思考和思考模式0.5元2元5元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称模式输入单价(每百万Token)非思考模式 输出单价(每百万Token)思考模式(思维链+回答) 输出单价(每百万Token)
qwen3-next-80b-a3b-thinking仅思考模式1.101元\-8.807元
qwen3-next-80b-a3b-instruct仅非思考模式1.101元8.807元\-
qwen3-235b-a22b-thinking-2507仅思考模式1.688元\-16.88元
qwen3-235b-a22b-instruct-2507仅非思考模式1.688元6.752元\-
qwen3-30b-a3b-thinking-2507仅思考模式1.468元\-17.614元
qwen3-30b-a3b-instruct-2507仅非思考模式1.468元5.871元\-
qwen3-235b-a22b非思考和思考模式5.137元20.55元61.65元
qwen3-32b非思考和思考模式1.174元4.697元4.697元
qwen3-30b-a3b非思考和思考模式1.468元5.871元17.614元
qwen3-14b非思考和思考模式2.569元10.275元30.825元
qwen3-8b非思考和思考模式1.321元5.137元15.412元
qwen3-4b非思考和思考模式0.807元3.082元9.247元
qwen3-1.7b非思考和思考模式0.807元3.082元9.247元
qwen3-0.6b非思考和思考模式0.807元3.082元9.247元

3.4 QwQ-开源版

计费规则:按输入Token和输出Token计费。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwq-32b2元6元

3.5 QwQ-Preview

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwq-32b-preview > Batch调用半价2元6元

3.6 Qwen2.5

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwen2.5-14b-instruct-1m1元3元
qwen2.5-7b-instruct-1m0.5元1元
qwen2.5-72b-instruct4元12元
qwen2.5-32b-instruct2元6元
qwen2.5-14b-instruct1元3元
qwen2.5-7b-instruct0.5元1元
qwen2.5-3b-instruct0.3元0.9元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

说明:国际(新加坡)模型无免费额度。

模型名称输入单价 (每百万Token)输出单价 (每百万Token)
qwen2.5-14b-instruct-1m5.908元23.632元
qwen2.5-7b-instruct-1m2.701元10.789元
qwen2.5-72b-instruct10.275元41.1元
qwen2.5-32b-instruct5.137元20.55元
qwen2.5-14b-instruct2.569元10.275元
qwen2.5-7b-instruct1.284元5.137元

3.7 QVQ

模型名称输入单价(每百万Token)输出单价(每百万Token)
qvq-72b-preview12元36元

3.8 Qwen-Omni

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称文本 输入单价(每百万Token)音频 输入单价(每百万Token)图片/视频 输入单价(每百万Token)文本 > 仅纯文本输入 输出单价(每百万Token)文本 > 多模态输入 输出单价(每百万Token)文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen2.5-omni-7b0.6元38元2元2.4元6元76元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称文本 输入单价(每百万Token)音频 输入单价(每百万Token)图片/视频 输入单价(每百万Token)文本 > 仅纯文本输入 输出单价(每百万Token)文本 > 多模态输入 输出单价(每百万Token)文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen2.5-omni-7b0.734元49.613元2.055元2.936元6.165元99.153元

3.9 Qwen3-Omni-Captioner

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwen3-omni-30b-a3b-captioner15.8元12.7元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwen3-omni-30b-a3b-captioner27.962元22.458元

3.10 Qwen-VL

1.中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称模式输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3-vl-235b-a22b-thinking仅思考模式2元20元
qwen3-vl-235b-a22b-instruct仅非思考模式2元8元
qwen3-vl-32b-thinking仅思考模式2元20元
qwen3-vl-32b-instruct仅非思考模式2元8元
qwen3-vl-30b-a3b-thinking仅思考模式0.75元7.5元
qwen3-vl-30b-a3b-instruct仅非思考模式0.75元3元
qwen3-vl-8b-thinking仅思考模式0.5元5元
qwen3-vl-8b-instruct仅非思考模式0.5元2元

更多模型

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwen2.5-vl-72b-instruct16元48元
qwen2.5-vl-32b-instruct8元24元
qwen2.5-vl-7b-instruct2元5元
qwen2.5-vl-3b-instruct1.2元3.6元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称模式输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3-vl-235b-a22b-thinking仅思考模式2元20元
qwen3-vl-235b-a22b-instruct仅非思考模式2元8元
qwen3-vl-32b-thinking仅思考模式1.174元4.697元
qwen3-vl-32b-instruct仅非思考模式1.174元4.697元
qwen3-vl-30b-a3b-thinking仅思考模式0.75元7.5元
qwen3-vl-30b-a3b-instruct仅非思考模式0.75元3元
qwen3-vl-8b-thinking仅思考模式0.5元5元
qwen3-vl-8b-instruct仅非思考模式0.5元2元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称模式输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
qwen3-vl-235b-a22b-thinking仅思考模式2.936元29.357元
qwen3-vl-235b-a22b-instruct仅非思考模式2.936元11.743元
qwen3-vl-32b-thinking仅思考模式1.174元4.697元
qwen3-vl-32b-instruct仅非思考模式1.174元4.697元
qwen3-vl-30b-a3b-thinking仅思考模式1.468元17.614元
qwen3-vl-30b-a3b-instruct仅非思考模式1.468元5.871元
qwen3-vl-8b-thinking仅思考模式1.321元15.412元
qwen3-vl-8b-instruct仅非思考模式1.321元5.137元

3.12 Qwen-Math

模型名称输入单价(每百万Token)输出单价(每百万Token)
qwen2.5-math-72b-instruct4元12元
qwen2.5-math-7b-instruct1元2元

3.13 Qwen-Coder

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token)
qwen3-coder-next0<Token≤32K1元4元
qwen3-coder-next32K<Token≤128K1.5元6元
qwen3-coder-next128K<Token≤256K2.5元10元
qwen3-coder-480b-a35b-instruct0<Token≤32K6元24元
qwen3-coder-480b-a35b-instruct32K<Token≤128K9元36元
qwen3-coder-480b-a35b-instruct128K<Token≤200K15元60元
qwen3-coder-30b-a3b-instruct0<Token≤32K1.5元6元
qwen3-coder-30b-a3b-instruct32K<Token≤128K2.25元9元
qwen3-coder-30b-a3b-instruct128K<Token≤200K3.75元15元
qwen2.5-coder-32b-instruct无阶梯计价2元6元
qwen2.5-coder-14b-instruct无阶梯计价2元6元
qwen2.5-coder-7b-instruct无阶梯计价1元2元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token)
qwen3-coder-480b-a35b-instruct0<Token≤32K6元24元
qwen3-coder-480b-a35b-instruct32K<Token≤128K9元36元
qwen3-coder-480b-a35b-instruct128K<Token≤200K15元60元
qwen3-coder-30b-a3b-instruct0<Token≤32K1.5元6元
qwen3-coder-30b-a3b-instruct32K<Token≤128K2.25元9元
qwen3-coder-30b-a3b-instruct128K<Token≤200K3.75元15元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token)
qwen3-coder-next0<Token≤32K2.202元11.009元
qwen3-coder-next32K<Token≤128K3.67元18.348元
qwen3-coder-next128K<Token≤256K5.871元29.357元
qwen3-coder-480b-a35b-instruct0<Token≤32K11.009元55.044元
qwen3-coder-480b-a35b-instruct32K<Token≤128K19.816元99.08元
qwen3-coder-480b-a35b-instruct128K<Token≤200K33.027元165.133元
qwen3-coder-30b-a3b-instruct0<Token≤32K3.303元16.513元
qwen3-coder-30b-a3b-instruct32K<Token≤128K5.504元27.522元
qwen3-coder-30b-a3b-instruct128K<Token≤200K8.807元44.035元

4. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。

模型名称单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token)
qwen3-coder-next0<Token≤32K2.248元11.241元
qwen3-coder-next32K<Token≤128K3.747元18.736元
qwen3-coder-next128K<Token≤256K5.995元29.977元

4、文本生成-第三方模型

4.1 DeepSeek

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
deepseek-v4-pro > 上下文缓存享有折扣12元24元
deepseek-v4-flash > 上下文缓存享有折扣1元2元
deepseek-v3.2 > 上下文缓存享有折扣2元3元
deepseek-v3.2-exp2元3元
deepseek-v3.14元12元
deepseek-r1 > Batch调用半价4元16元
deepseek-r1-05284元16元
deepseek-v3 > Batch调用半价2元8元
deepseek-r1-distill-qwen-1.5b限时免费限时免费
deepseek-r1-distill-qwen-7b0.5元1元
deepseek-r1-distill-qwen-14b1元3元
deepseek-r1-distill-qwen-32b2元6元
deepseek-r1-distill-llama-8b限时免费限时免费

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
deepseek-v4-pro > 上下文缓存享有折扣12元24元
deepseek-v4-flash > 上下文缓存享有折扣1元2元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
deepseek-v3.2 > 上下文缓存享有折扣4.272元12.815元

4.2 DeepSeek-硅基流动

说明:服务部署范围仅支持中国内地。

模型名称输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
siliconflow/deepseek-v3.22元3元
siliconflow/deepseek-v3.1-terminus4元12元
siliconflow/deepseek-r1-05284元16元
siliconflow/deepseek-v3-03242元8元

4.3 DeepSeek-快手万擎

模型名称输入单价(每百万Token)输出单价(每百万Token) > 思维链+回答
vanchin/deepseek-v3.2-think > 上下文缓存享有折扣2元3元
vanchin/deepseek-v3.1-terminus > 上下文缓存享有折扣4元12元
vanchin/deepseek-r1 > 上下文缓存享有折扣4元16元
vanchin/deepseek-v3 > 上下文缓存享有折扣2元8元
vanchin/deepseek-ocr0.216元0.216元

4.4 Kimi

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称模式输入单价(每百万Token)输出单价(每百万Token)
kimi-k2.6非思考和思考模式6.5元27元
kimi-k2.5非思考和思考模式4元21元
kimi-k2-thinking仅思考模式4元16元
Moonshot-Kimi-K2-Instruct非思考模式4元16元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称模式输入单价(每百万Token)输出单价(每百万Token)
kimi-k2.5非思考和思考模式4元21元

4.5 Kimi-月之暗面

模型名称输入单价(每百万Token)输出单价(每百万Token) > 思维链和回答
kimi/kimi-k2.6 > 上下文缓存享有折扣6.5元27元
kimi/kimi-k2.5 > 上下文缓存享有折扣4元21元

4.6 GLM

模型名称模式单次请求的输入Token数输入单价(每百万Token)输出单价(每百万Token) > 思维链和回答
glm-5.1非思考和思考模式0<Token≤32K6元24元
glm-5.1非思考和思考模式32K<Token≤200K8元28元
glm-5非思考和思考模式0<Token≤32K4元18元
glm-5非思考和思考模式32K<Token≤198K6元22元
glm-4.7非思考和思考模式0<Token≤32K3元14元
glm-4.7非思考和思考模式32K<Token≤166K4元16元
glm-4.6非思考和思考模式0<Token≤32K3元14元
glm-4.6非思考和思考模式32K<Token≤166K4元16元
glm-4.5非思考和思考模式0<Token≤32K3元14元
glm-4.5非思考和思考模式32K<Token≤96K4元16元
glm-4.5-air非思考和思考模式0<Token≤32K0.8元6元
glm-4.5-air非思考和思考模式32K<Token≤96K1.2元8元

4.7 MiniMax

模型名称模式输入单价(每百万Token)输出单价(每百万Token) > 思维链和回答
MiniMax-M2.5仅思考模式2.1元8.4元
MiniMax-M2.1仅思考模式2.1元8.4元

4.8 MiniMax-稀宇科技

模型名称模式输入单价(每百万Token)输出单价(每百万Token) > 思维链和回答
MiniMax/MiniMax-M2.7 > 上下文缓存享有折扣仅思考模式2.1元8.4元
MiniMax/MiniMax-M2.5 > 上下文缓存享有折扣仅思考模型2.1元8.4元
MiniMax/MiniMax-M2.1 > 上下文缓存享有折扣仅思考模式2.1元8.4元

5、图像生成

计费规则:输入不计费,输出计费。输出按成功生成的 图像张数 计费。
计费公式:费用 = 图像单价 × 输出的图像张数

计费说明:

  • 费用与输出图像的分辨率、宽高比无关。
  • 请求失败不产生任何费用,也不消耗免费额度。

计费示例:部分图像生成失败
假设图像单价为 0.10元/张。若您调用接口请求生成 4 张图像,但实际仅成功返回 3 张图像的 URL,另 1 张生成失败,系统将仅对成功生成的图像进行计费。

  • 计费数量:3 张。
  • 费用计算:0.1 × 3 = 0.3元。

5.1 千问文生图

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称输出单价
qwen-image-2.0-pro0.5元/张
qwen-image-2.0-pro-2026-04-220.5元/张
qwen-image-2.0-pro-2026-03-030.5元/张
qwen-image-2.00.2元/张
qwen-image-2.0-2026-03-030.2元/张
qwen-image-max0.5元/张
qwen-image-max-2025-12-300.5元/张
qwen-image-plus0.2元/张
qwen-image-plus-2026-01-090.2元/张
qwen-image0.25元/张

2. 国际

模型名称输出单价
qwen-image-2.0-pro0.550443元/张
qwen-image-2.0-pro-2026-04-220.550443元/张
qwen-image-2.0-pro-2026-03-030.550443元/张
qwen-image-2.00.256873元/张
qwen-image-2.0-2026-03-030.256873元/张
qwen-image-max0.550443元/张
qwen-image-max-2025-12-300.550443元/张
qwen-image-plus0.220177元/张
qwen-image-plus-2026-01-090.220177元/张
qwen-image0.256873元/张

5.2 千问图像编辑

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称输出单价
qwen-image-2.0-pro0.5元/张
qwen-image-2.0-pro-2026-04-220.5元/张
qwen-image-2.0-pro-2026-03-030.5元/张
qwen-image-2.00.2元/张
qwen-image-2.0-2026-03-030.2元/张
qwen-image-edit-max0.5元/张
qwen-image-edit-max-2026-01-160.5元/张
qwen-image-edit-plus0.2元/张
qwen-image-edit-plus-2025-12-150.2元/张
qwen-image-edit-plus-2025-10-300.2元/张
qwen-image-edit0.3元/张

2. 国际

模型名称输出单价
qwen-image-2.0-pro0.550443元/张
qwen-image-2.0-pro-2026-04-220.550443元/张
qwen-image-2.0-pro-2026-03-030.550443元/张
qwen-image-2.00.256873元/张
qwen-image-2.0-2026-03-030.256873元/张
qwen-image-edit-max0.550443元/张
qwen-image-edit-max-2026-01-160.550443元/张
qwen-image-edit-plus0.220177元/张
qwen-image-edit-plus-2025-12-150.220177元/张
qwen-image-edit-plus-2025-10-300.220177元/张
qwen-image-edit0.330266元/张

5.3 千问图像翻译

模型名称输出单价
qwen-mt-image0.003元/张

5.4 Z-Image

1. 中国内地

模型名称输出单价
z-image-turbo关闭提示词改写(prompt_extend=false):0.1元/张 开启提示词改写(prompt_extend=true):0.2元/张

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称输出单价
z-image-turbo关闭提示词改写(prompt_extend=false):0.110089元/张 开启提示词改写(prompt_extend=true):0.220177元/张

5.5 万相文生图

1. 中国内地

模型名称输出单价
wan2.6-t2i0.20元/张
wan2.5-t2i-preview0.20元/张
wan2.2-t2i-plus0.20元/张
wan2.2-t2i-flash0.14元/张
wanx2.1-t2i-plus0.20元/张
wanx2.1-t2i-turbo0.14元/张
wanx2.0-t2i-turbo0.04元/张
wanx-v10.16元/张

2. 全球

模型名称输出单价
wan2.6-t2i0.20元/张

3. 国际

模型名称输出单价
wan2.6-t2i0.220177元/张
wan2.5-t2i-preview0.220177元/张
wan2.2-t2i-plus0.366962元/张
wan2.2-t2i-flash0.183481元/张
wan2.1-t2i-plus0.366962元/张
wan2.1-t2i-turbo0.183481元/张

5.6 万相图像生成与编辑

1. 中国内地

模型名称输出单价
wan2.7-image-pro0.50元/张
wan2.7-image0.20元/张
wan2.6-image0.20元/张

2. 全球

模型名称输出单价
wan2.6-image0.20元/张

3. 国际

模型名称输出单价
wan2.7-image-pro0.562065元/张
wan2.7-image0.220177元/张
wan2.6-image0.220177元/张

5.7 万相通用图像编辑

1. 中国内地

模型名称输出单价
wan2.5-i2i-preview0.20元/张50张
wanx2.1-imageedit0.14元/张500张

2. 国际

模型名称输出单价
wan2.5-i2i-preview0.220177元/张

5.8 万相涂鸦作画

模型名称输出单价
wanx-sketch-to-image-lite0.06元/张

5.9 万相图像局部重绘

模型名称输出单价
wanx-x-painting目前仅供免费体验。 > 免费额度用完后不可调用

5.10 人像风格重绘

模型名称输出单价
wanx-style-repaint-v10.12元/张

5.11 图像背景生成

模型名称输出单价
wanx-background-generation-v20.08元/张

5.12 图像画面扩展

模型名称输出单价
image-out-painting0.18元/张

5.13 人物实例分割

模型名称输出单价
image-instance-segmentation目前仅供免费体验。 > 免费额度用完后不可调用。

5.14 图像擦除补全

模型名称输出单价
image-erase-completion目前仅供免费体验。 > 免费额度用完后不可调用

5.15 虚拟模特

模型名称输出单价
wanx-virtualmodel目前仅供免费体验。 > 免费额度用完后不可调用
virtualmodel-v2

5.16 鞋靴模特

模型名称输出单价
shoemodel-v1目前仅供免费体验。 > 免费额度用完后不可调用。

5.17 创意海报生成

模型名称输出单价
wanx-poster-generation-v1目前仅供免费体验。 > 免费额度用完后不可调用

5.18 人物写真生成-FaceChain

  • facechain-facedetect:限时免费。
  • facechain-finetune:按训练次数计费,请求失败不计费。
  • facechain-generation:输入不计费,输出计费。
模型服务模型名称单价
人物图像检测facechain-facedetect限时免费
人物形象训练facechain-finetune2.5元/次
人物写真生成facechain-generation0.18元/张

5.19 创意文字生成-WordArt锦书

模型服务模型名称输出单价
文字纹理生成wordart-texture0.08元/张
文字变形wordart-semantic0.24元/张

更多模型调用计费可通过百炼控制台查询。

2026年截至目前,阿里云的AI产品优惠权益还有阿里云百炼 Token Plan,提供多档位套餐,包月预算可控;Qwen3.6 发布,全模型通享 4.5 折;旗舰模型入门首选,适配千行百业 AI 落地;AI 创新场景应用,开箱即用,适配千行百业 AI 落地;阿里云百炼按量达标返券,先用后返,最高返200元;阿里云 JVS Claw 39元起,一键接入 OpenClaw;先进弹性的 AI 算力,高性价比 AI 算力,快速部署千问大模型等其他优惠,详情可通过阿里云权益中心了解:https://www.aliyun.com/benefit

除了AI产品优惠权益之外,云服务器相关活动也是用户非常关心的,在阿里云2026年的活动中,参与活动的云服务器主要有经济型e实例2核2G3M带宽40G ESSD Entry云盘99元1年;通用算力型u1实例2核4G5M带宽80G ESSD云盘企业专享199元1年,轻量云服务器2核2G200M峰值带宽38元一年、2核4G200M峰值带宽9.9元1个月和199元一年,以及通用算力型u2a实例2.5折起,通用算力型u2i实例3折,九代c9i、g9i、r9i等实例1年付6.4折起等其他实例规格的云服务器。更多云产品配置和实时价格可通过阿里云的活动中心:https://t.aliyun.com/U/3vGTeD 查询当前参与活动的云服务器和其他云产品配置的价格信息以及优惠券等信息,如下图所示:

购买之前建议先了解一下当下是否有优惠券或者代金券可以领取,2026年,阿里云官方已经通过云小站平台:https://www.aliyun.com/minisite/goods 推出云产品通用7.5折优惠券,先领券再购买,价格可以在优惠价格基础上额外获得一个7.5折优惠,最高能减12500元。

小结:阿里云百炼作为一站式大模型开发与应用平台,凭借其丰富的模型种类、强大的多模态能力、广泛的第三方开源模型接入以及灵活的调用计费机制,为开发者提供了高效、便捷、经济的AI开发环境。无论是复杂任务处理、通用场景应用,还是专用工具开发,阿里云百炼都能提供针对性的解决方案。同时,新人免费额度政策和详细的计费规则,进一步降低了AI开发的门槛和成本,使得更多企业和开发者能够轻松拥抱AI,推动业务创新与发展。

本文原创链接:https://www.tengxunyun8.com/19043.html
版权所有,如未注明,均为原创,转载请注明