阿里云百炼大模型服务平台介绍：企业级模型服务和应用开发，7000万免费Tokens助力AI快速落地

2026年5月8日20:59

阿里云百炼大模型服务平台是集成千问及DeepSeek、Kimi等主流第三方模型的一站式开发与应用平台，提供兼容OpenAI的API及模型调用、调优、部署、应用构建等全链路服务。平台具备丰富的模型生态、可视化低代码开发工具、企业级数据安全合规保障及灵活的阶梯计费模式，支持智能体创建、知识库问答等AI应用快速落地，助力企业实现智能化升级。2026年新用户开通即享超7000万免费Tokens，有效期90天，仅限模型推理调用，有效降低初期成本。本文将详细介绍平台核心功能、各模型收费标准及免费额度使用规则等用户关切问题。

一、阿里云百炼大模型服务平台介绍

阿里云百炼大模型服务平台是阿里云推出的一站式企业级大模型开发与应用构建平台，集成通义千问系列及第三方大模型（如DeepSeek、Kimi等），提供全链路工具和服务。其核心功能包括：

模型服务：提供开箱即用的模型调用能力，支持通义千问（Qwen）全系列模型（Max/Plus/Flash）、多模态及垂直领域模型。
模型调优与部署：支持通过有监督微调（SFT）、继续预训练（CPT）等方法定制专属模型，并提供灵活的部署方案（如资源专享推理服务）。
应用构建：通过智能体（Agent）、工作流（Workflow）和高代码应用三种模式，实现零代码/低代码开发，快速落地AI客服、数据分析、门户网站等场景。
生态整合：支持知识库（RAG）、插件、模型上下文协议（MCP）等扩展功能，并与阿里云其他产品（如Elasticsearch）深度集成。

二、阿里云百炼大模型服务平台的优势

1. 丰富的模型生态与灵活性

多模型选择：覆盖通义千问（Qwen）全系列（Max/Plus/Flash）、DeepSeek、Kimi等第三方模型，满足复杂任务（如推理、创作）与高性价比需求。
多模态能力：支持文本生成、图像处理、语音识别、视频分析等，适配多样化业务场景。

2. 全链路开发与快速落地

模型调优简单高效：提供界面化工具，即使无AI背景也可通过数据集快速微调模型，提升领域准确性。
低/零代码开发：
- 智能体应用：通过自然语言配置，构建如客服、问答等开放场景的AI助手。
- 工作流应用：可视化节点编排，实现固定流程自动化（如数据标注、订单处理）。
- 高代码应用：支持Python代码开发，深度集成复杂系统。

3. 企业级安全与合规保障

数据隔离与加密：用户数据严格保密，不用于模型训练，传输过程加密。
合规资质支持：提供应用备案与合作协议申请，满足企业级合规要求。

4. 成本优化与灵活计费

免费资源与订阅计划：提供免费试用（如200元试用点）、Coding Plan等订阅套餐，降低初期成本。
按需付费：支持按Token量、模型部署时长或包月计费，灵活适配业务波动。

5. 高效的生态与技术支持

预置解决方案：超过20个行业模板（如电商客服、漫剧生成、数据分析），加速业务落地。
深度集成阿里云产品：与Elasticsearch等服务无缝对接，支持复杂场景的智能推理。

6. 高扩展性与场景适配性

插件与API支持：通过插件调用外部服务（如高德地图）、接入私有数据，扩展应用功能。
多地域部署：覆盖北京、新加坡、美国等，就近选择地域降低网络延迟。

三、阿里云百炼大模型服务新人免费额度介绍

2026年面向所有阿里云用户，提供百余款千问系列大模型和国内优质开源三方大模型，新用户开通即享超7000万免费tokens。该活动属于阿里云“AI产品免费试用”计划的一部分，旨在帮助新用户零成本体验大模型能力，快速构建AI应用。 AI产品免费试用活动详情：https://free.aliyun.com/product/ai

1、活动内容

免费额度总量：新用户在开通阿里云百炼后，可获得总计超过7000万 tokens 的免费推理额度，用于调用百炼平台上架的大模型（包括通义千问系列及第三方模型）。
覆盖模型范围：免费额度适用于百炼平台提供的百余款通义系列大模型及国内优质开源第三方大模型。
典型模型示例：
- Qwen-Max：提供100万免费tokens；
- Qwen-Plus：提供1200万tokens的资源包体验（部分通过资源包形式发放）；
- 其他如Qwen3、Qwen3-Coder、通义万相（图像/视频生成）等也包含在免费体验范围内。

详情可通过阿里云百炼大模型服务平台进入：https://www.aliyun.com/product/bailian

2、活动规则

参与条件：
- 用户需注册阿里云账号并完成实名认证；
- 首次开通阿里云百炼服务（以中国内地版为准）。
免费额度有效期：
- 自2025年9月8日11点起，新开通用户获赠的免费额度有效期统一为90天；
- 此前已开通的用户仍按原规则（30～90天）执行。
使用范围限制：
- 免费额度仅可用于模型的实时推理调用；
- 不支持抵扣以下场景：
  - Batch批量调用；
  - 上下文缓存；
  - 模型调优（SFT/CPT等）；
  - 模型部署；
  - 自定义模型（包括调优后或已部署的模型）。
额度共享机制：
- 阿里云主账号与其RAM子账号共享免费额度。例如，若Qwen-Max总免费额度为100万tokens，主账号与子账号共同消耗，总额不超过该上限。
额度查看方式：
- 可通过百炼控制台的“模型用量”页面 → “免费额度”页签查看；
- 或在“模型广场”中选择具体模型版本，在详情页查看剩余额度（数据分钟级更新，需手动刷新）。
超额计费：
- 免费额度耗尽或到期后，继续调用模型将按标准价格计费。

四、模型调用收费标准

1、阶梯计费规则

百炼部分模型实行阶梯计费。单价取决于单次请求的输入 Token 总量。该请求的所有 Token 均按对应阶梯的单价结算。

例如，某模型设有两档计费区间：0 < Token ≤ 32K 和 32K < Token ≤ 128K。若输入 100K Token，因数值落在第二区间（32K < 100K ≤ 128K），所有 Token 均按第二档单价结算。

2、文本生成-千问

2.1 千问Max

计费规则：按输入Token和输出Token计费。

影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费；若模型支持上下文缓存，仅输入Token享有折扣。两者不能同时生效。

1.中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3.6-max-preview > 上下文缓存享有折扣	非思考和思考模式	0<Token≤128K	9元	54元
qwen3.6-max-preview > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	15元	90元
qwen3-max > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	2.5元	10元
qwen3-max > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	4元	16元
qwen3-max > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	7元	28元
qwen3-max-2026-01-23	非思考和思考模式	0<Token≤32K	2.5元	10元
qwen3-max-2026-01-23	非思考和思考模式	32K<Token≤128K	4元	16元
qwen3-max-2026-01-23	非思考和思考模式	128K<Token≤256K	7元	28元
qwen3-max-2025-09-23	仅非思考模式	0<Token≤32K	6元	24元
qwen3-max-2025-09-23	仅非思考模式	32K<Token≤128K	10元	40元
qwen3-max-2025-09-23	仅非思考模式	128K<Token≤256K	15元	60元
qwen3-max-preview > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	6元	24元
qwen3-max-preview > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	10元	40元
qwen3-max-preview > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	15元	60元

更多模型

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen-max > Batch调用半价	仅非思考模式	无阶梯计价	2.4元	9.6元
qwen-max-latest > Batch调用半价	仅非思考模式	无阶梯计价	2.4元	9.6元
qwen-max-2025-01-25	仅非思考模式	无阶梯计价	2.4元	9.6元
qwen-max-2024-09-19	仅非思考模式	无阶梯计价	20元	60元
qwen-max-2024-04-28	仅非思考模式	无阶梯计价	40元	120元

2. 全球
服务部署范围为全球时，模型推理计算资源在全球范围内动态调度；静态数据存储于您所选的地域。该部署范围支持的地域：美国（弗吉尼亚）、德国（法兰克福）。

说明：全球部署范围下的模型无免费额度。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3-max > 上下文缓存享有折扣	仅非思考模式	0<Token≤32K	2.5元	10元
qwen3-max > 上下文缓存享有折扣	仅非思考模式	32K<Token≤128K	4元	16元
qwen3-max > 上下文缓存享有折扣	仅非思考模式	128K<Token≤256K	7元	28元
qwen3-max-2025-09-23	仅非思考模式	0<Token≤32K	6元	24元
qwen3-max-2025-09-23	仅非思考模式	32K<Token≤128K	10元	40元
qwen3-max-2025-09-23	仅非思考模式	128K<Token≤256K	15元	60元
qwen3-max-preview > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	6元	24元
qwen3-max-preview > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	10元	40元
qwen3-max-preview > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	15元	60元

3. 国际
服务部署范围为国际时，模型推理计算资源在全球范围内动态调度（不含中国内地）；静态数据存储于您所选的地域。该部署范围支持的地域：新加坡。

说明：国际部署范围下的模型无免费额度。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3.6-max-preview > 上下文缓存享有折扣	非思考和思考模式	0<Token≤128K	9.742元	58.455元
qwen3.6-max-preview > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	14.988元	89.93元
qwen3-max > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	8.807元	44.035元
qwen3-max > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	17.614元	88.071元
qwen3-max > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	22.018元	110.089元
qwen3-max-2026-01-23	非思考和思考模式	0<Token≤32K	8.807元	44.035元
qwen3-max-2026-01-23	非思考和思考模式	32K<Token≤128K	17.614元	88.071元
qwen3-max-2026-01-23	非思考和思考模式	128K<Token≤256K	22.018元	110.089元
qwen3-max-2025-09-23	仅非思考模式	0<Token≤32K	8.807元	44.035元
qwen3-max-2025-09-23	仅非思考模式	32K<Token≤128K	17.614元	88.071元
qwen3-max-2025-09-23	仅非思考模式	128K<Token≤256K	22.018元	110.089元
qwen3-max-preview > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	8.807元	44.035元
qwen3-max-preview > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	17.614元	88.071元
qwen3-max-preview > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	22.018元	110.089元

更多模型

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen-max > Batch调用半价	仅非思考模式	无阶梯计价	11.743元	46.971元
qwen-max-latest	仅非思考模式	无阶梯计价	11.743元	46.971元
qwen-max-2025-01-25	仅非思考模式	无阶梯计价	11.743元	46.971元

4. 欧盟
服务部署范围为欧盟时，模型推理计算资源仅限于欧盟境内；静态数据存储于您所选的地域。该部署范围支持的地域：德国（法兰克福）。

说明：欧盟部署范围下的模型无免费额度。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3-max	非思考和思考模式	0<Token≤32K	8.993元	44.965元
qwen3-max	非思考和思考模式	32K<Token≤128K	17.986元	89.93元
qwen3-max	非思考和思考模式	128K<Token≤256K	22.483元	112.413元
qwen3-max-2026-01-23	非思考和思考模式	0<Token≤32K	8.993元	44.965元
qwen3-max-2026-01-23	非思考和思考模式	32K<Token≤128K	17.986元	89.93元
qwen3-max-2026-01-23	非思考和思考模式	128K<Token≤256K	22.483元	112.413元

2.2 千问Plus

计费规则：按输入Token和输出Token计费。
影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3.6-plus	0<Token≤256K	2元	12元	12元
qwen3.6-plus	256K<Token≤1M	8元	48元	48元
qwen3.6-plus-2026-04-02	0<Token≤256K	2元	12元	12元
qwen3.6-plus-2026-04-02	256K<Token≤1M	8元	48元	48元
qwen3.5-plus	0<Token≤128K	0.8元	4.8元	4.8元
qwen3.5-plus	128K<Token≤256K	2元	12元	12元
qwen3.5-plus	256K<Token≤1M	4元	24元	24元
qwen3.5-plus-2026-04-20	0<Token≤128K	0.8元	4.8元	4.8元
qwen3.5-plus-2026-04-20	128K<Token≤256K	2元	12元	12元
qwen3.5-plus-2026-04-20	256K<Token≤1M	4元	24元	24元
qwen3.5-plus-2026-02-15	0<Token≤128K	0.8元	4.8元	4.8元
qwen3.5-plus-2026-02-15	128K<Token≤256K	2元	12元	12元
qwen3.5-plus-2026-02-15	256K<Token≤1M	4元	24元	24元
qwen-plus > Batch调用半价	0<Token≤128K	0.8元	2元	8元
qwen-plus > Batch调用半价	128K<Token≤256K	2.4元	20元	24元
qwen-plus > Batch调用半价	256K<Token≤1M	4.8元	48元	64元
qwen-plus-latest > Batch调用半价	0<Token≤128K	0.8元	2元	8元
qwen-plus-latest > Batch调用半价	128K<Token≤256K	2.4元	20元	24元
qwen-plus-latest > Batch调用半价	256K<Token≤1M	4.8元	48元	64元
qwen-plus-2025-12-01	0<Token≤128K	0.8元	2元	8元
qwen-plus-2025-12-01	128K<Token≤256K	2.4元	20元	24元
qwen-plus-2025-12-01	256K<Token≤1M	4.8元	48元	64元
qwen-plus-2025-09-11	0<Token≤128K	0.8元	2元	8元
qwen-plus-2025-09-11	128K<Token≤256K	2.4元	20元	24元
qwen-plus-2025-09-11	256K<Token≤1M	4.8元	48元	64元
qwen-plus-2025-07-28	0<Token≤128K	0.8元	2元	8元
qwen-plus-2025-07-28	128K<Token≤256K	2.4元	20元	24元
qwen-plus-2025-07-28	256K<Token≤1M	4.8元	48元	64元
qwen-plus-2025-07-14	无阶梯计价	0.8元	2元	8元
qwen-plus-2025-04-28	无阶梯计价	0.8元	2元	8元

更多模型

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）
qwen-plus-2025-01-25	无阶梯计价	0.8元	2元
qwen-plus-2025-01-12	无阶梯计价	0.8元	2元
qwen-plus-2024-12-20	无阶梯计价	0.8元	2元

说明：全球部署范围下的模型无免费额度。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3.6-plus	0<Token≤256K	2元	12元	12元
qwen3.6-plus	256K<Token≤1M	8元	48元	48元
qwen3.6-plus-2026-04-02	0<Token≤256K	2元	12元	12元
qwen3.6-plus-2026-04-02	256K<Token≤1M	8元	48元	48元
qwen3.5-plus	0<Token≤128K	0.8元	4.8元	4.8元
qwen3.5-plus	128K<Token≤256K	2元	12元	12元
qwen3.5-plus	256K<Token≤1M	4元	24元	24元
qwen3.5-plus-2026-02-15	0<Token≤128K	0.8元	4.8元	4.8元
qwen3.5-plus-2026-02-15	128K<Token≤256K	2元	12元	12元
qwen3.5-plus-2026-02-15	256K<Token≤1M	4元	24元	24元
qwen-plus	0<Token≤128K	0.8元	2元	8元
qwen-plus	128K<Token≤256K	2.4元	20元	24元
qwen-plus	256K<Token≤1M	4.8元	48元	64元
qwen-plus-2025-12-01	0<Token≤128K	0.8元	2元	8元
qwen-plus-2025-12-01	128K<Token≤256K	2.4元	20元	24元
qwen-plus-2025-12-01	256K<Token≤1M	4.8元	48元	64元
qwen-plus-2025-09-11	0<Token≤128K	0.8元	2元	8元
qwen-plus-2025-09-11	128K<Token≤256K	2.4元	20元	24元
qwen-plus-2025-09-11	256K<Token≤1M	4.8元	48元	64元
qwen-plus-2025-07-28	0<Token≤128K	0.8元	2元	8元
qwen-plus-2025-07-28	128K<Token≤256K	2.4元	20元	24元
qwen-plus-2025-07-28	256K<Token≤1M	4.8元	48元	64元

说明：国际部署范围下的模型无免费额度。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3.6-plus	0<Token≤256K	3.7471元	22.4826元	22.4826元
qwen3.6-plus	256K<Token≤1M	14.9884元	44.965元	44.965元
qwen3.6-plus-2026-04-02	0<Token≤256K	3.7471元	22.4826元	22.4826元
qwen3.6-plus-2026-04-02	256K<Token≤1M	14.9884元	44.965元	44.965元
qwen3.5-plus	0<Token≤256K	2.936元	17.614元	17.614元
qwen3.5-plus	256K<Token≤1M	3.67元	22.018元	22.018元
qwen3.5-plus-2026-04-20	0<Token≤256K	2.936元	17.614元	17.614元
qwen3.5-plus-2026-04-20	256K<Token≤1M	3.67元	22.018元	22.018元
qwen3.5-plus-2026-02-15	0<Token≤256K	2.936元	17.614元	17.614元
qwen3.5-plus-2026-02-15	256K<Token≤1M	3.67元	22.018元	22.018元
qwen-plus	0<Token≤256K	2.936元	8.807元	29.357元
qwen-plus	256K<Token≤1M	8.807元	26.421元	88.071元
qwen-plus-latest	0<Token≤256K	2.936元	8.807元	29.357元
qwen-plus-latest	256K<Token≤1M	8.807元	26.421元	88.071元
qwen-plus-2025-12-01	0<Token≤256K	2.936元	8.807元	29.357元
qwen-plus-2025-12-01	256K<Token≤1M	8.807元	26.421元	88.071元
qwen-plus-2025-09-11	0<Token≤256K	2.936元	8.807元	29.357元
qwen-plus-2025-09-11	256K<Token≤1M	8.807元	26.421元	88.071元
qwen-plus-2025-07-28	0<Token≤256K	2.936元	8.807元	29.357元
qwen-plus-2025-07-28	256K<Token≤1M	8.807元	26.421元	88.071元
qwen-plus-2025-07-14	无阶梯计价	2.936元	8.807元	29.357元
qwen-plus-2025-04-28	无阶梯计价	2.936元	8.807元	29.357元

4. 美国
服务部署范围为美国时，模型推理计算资源仅限于美国境内；静态数据存储于您所选的地域。该部署范围支持的地域：美国（弗吉尼亚）。

说明：美国部署范围下的模型无免费额度。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen-plus-us > 上下文缓存享有折扣	0<Token≤256K	2.936元	8.807元	29.357元
qwen-plus-us > 上下文缓存享有折扣	256K<Token≤1M	8.807元	26.421元	88.071元
qwen-plus-2025-12-01-us	0<Token≤256K	2.936元	8.807元	29.357元
qwen-plus-2025-12-01-us	256K<Token≤1M	8.807元	26.421元	88.071元

5. 欧盟
服务部署范围为欧盟时，模型推理计算资源仅限于欧盟境内；静态数据存储于您所选的地域。该部署范围支持的地域：德国（法兰克福）。

说明：欧盟部署范围下的模型无免费额度。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen-plus	0<Token≤256K	2.998元	8.993元	29.977元
qwen-plus	256K<Token≤1M	8.993元	26.979元	89.93元
qwen-plus-2025-12-01	0<Token≤256K	2.998元	8.993元	29.977元
qwen-plus-2025-12-01	256K<Token≤1M	8.993元	26.979元	89.93元

2.3 千问Flash

计费规则：按输入Token和输出Token计费。
影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费；若模型支持上下文缓存，仅输入Token享有折扣。两者不能同时生效。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3.6-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	0<Token≤256K	1.2元	7.2元
qwen3.6-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	256K<Token≤1M	4.8元	28.8元
qwen3.6-flash-2026-04-16	非思考和思考模式	0<Token≤256K	1.2元	7.2元
qwen3.6-flash-2026-04-16	非思考和思考模式	256K<Token≤1M	4.8元	28.8元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	0<Token≤128K	0.2元	2元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	0.8元	8元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	256K<Token≤1M	1.2元	12元
qwen3.5-flash-2026-02-23	非思考和思考模式	0<Token≤128K	0.2元	2元
qwen3.5-flash-2026-02-23	非思考和思考模式	128K<Token≤256K	0.8元	8元
qwen3.5-flash-2026-02-23	非思考和思考模式	256K<Token≤1M	1.2元	12元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	0<Token≤128K	0.15元	1.5元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	0.6元	6元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	256K<Token≤1M	1.2元	12元
qwen-flash-2025-07-28	非思考和思考模式	0<Token≤128K	0.15元	1.5元
qwen-flash-2025-07-28	非思考和思考模式	128K<Token≤256K	0.6元	6元
qwen-flash-2025-07-28	非思考和思考模式	256K<Token≤1M	1.2元	12元

说明：全球部署范围下的模型无免费额度。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3.6-flash > 上下文缓存享有折扣	非思考和思考模式	0<Token≤256K	1.2元	7.2元
qwen3.6-flash > 上下文缓存享有折扣	非思考和思考模式	256K<Token≤1M	4.8元	28.8元
qwen3.6-flash-2026-04-16	非思考和思考模式	0<Token≤256K	1.2元	7.2元
qwen3.6-flash-2026-04-16	非思考和思考模式	256K<Token≤1M	4.8元	28.8元
qwen3.5-flash > 上下文缓存享有折扣	非思考和思考模式	0<Token≤128K	0.2元	2元
qwen3.5-flash > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	0.8元	8元
qwen3.5-flash > 上下文缓存享有折扣	非思考和思考模式	256K<Token≤1M	1.2元	12元
qwen3.5-flash-2026-02-23	非思考和思考模式	0<Token≤128K	0.2元	2元
qwen3.5-flash-2026-02-23	非思考和思考模式	128K<Token≤256K	0.8元	8元
qwen3.5-flash-2026-02-23	非思考和思考模式	256K<Token≤1M	1.2元	12元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	0<Token≤128K	0.15元	1.5元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	0.6元	6元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	256K<Token≤1M	1.2元	12元
qwen-flash-2025-07-28	非思考和思考模式	0<Token≤128K	0.15元	1.5元
qwen-flash-2025-07-28	非思考和思考模式	128K<Token≤256K	0.6元	6元
qwen-flash-2025-07-28	非思考和思考模式	256K<Token≤1M	1.2元	12元

说明：国际部署范围下的模型无免费额度。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3.6-flash > 上下文缓存享有折扣	非思考和思考模式	0<Token≤256K	1.87355元	11.2413元
qwen3.6-flash > 上下文缓存享有折扣	非思考和思考模式	256K<Token≤1M	7.4942元	29.9758元
qwen3.6-flash-2026-04-16	非思考和思考模式	0<Token≤256K	1.87355元	11.2413元
qwen3.6-flash-2026-04-16	非思考和思考模式	256K<Token≤1M	7.4942元	29.9758元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	0<Token≤1M	0.734元	2.936元
qwen3.5-flash-2026-02-23	非思考和思考模式	0<Token≤1M	0.734元	2.936元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	0<Token≤256K	0.367元	2.936元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	256K<Token≤1M	1.835元	14.678元
qwen-flash-2025-07-28	非思考和思考模式	0<Token≤256K	0.367元	2.936元
qwen-flash-2025-07-28	非思考和思考模式	256K<Token≤1M	1.835元	14.678元

4. 美国
服务部署范围为美国时，模型推理计算资源仅限于美国境内；静态数据存储于您所选的地域。该部署范围支持的地域：美国（弗吉尼亚）。

说明：美国部署范围下的模型无免费额度。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）
qwen-flash-us > 上下文缓存享有折扣	0<Token≤256K	0.367元	2.936元
qwen-flash-us > 上下文缓存享有折扣	256K<Token≤1M	1.835元	14.678元
qwen-flash-2025-07-28-us	0<Token≤256K	0.367元	2.936元
qwen-flash-2025-07-28-us	256K<Token≤1M	1.835元	14.678元

5. 欧盟
服务部署范围为欧盟时，模型推理计算资源仅限于欧盟境内；静态数据存储于您所选的地域。该部署范围支持的地域：德国（法兰克福）。

说明：欧盟部署范围下的模型无免费额度。

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3.5-flash	非思考和思考模式	0.749元	2.998元
qwen3.5-flash-2026-02-23	非思考和思考模式	0.749元	2.998元

2.4 千问Turbo

计费规则：按输入Token和输出Token计费。

影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	模式	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen-turbo > Batch调用半价	非思考和思考模式	0.3元	0.6元	3元
qwen-turbo-latest > Batch调用半价	非思考和思考模式	0.3元	0.6元	3元
qwen-turbo-2025-07-15	非思考和思考模式	0.3元	0.6元	3元
qwen-turbo-2025-04-28	非思考和思考模式	0.3元	0.6元	3元

更多模型

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度有效期：百炼开通后90天内
qwen-turbo-2025-02-11	0.3元	0.6元	100万Token
qwen-turbo-2024-11-01	0.3元	0.6元	1000万Token

2. 国际
服务部署范围为国际时，模型推理计算资源在全球范围内动态调度（不含中国内地）；静态数据存储于您所选的地域。该部署范围支持的地域：新加坡。

模型名称	模式	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen-turbo > Batch调用半价	非思考和思考	0.367元	1.468元	3.67元
qwen-turbo-latest	非思考和思考	0.367元	1.468元	3.67元
qwen-turbo-2025-04-28	非思考和思考	0.367元	1.468元	3.67元

更多模型

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-turbo-2024-11-01	0.367元	1.468元

2.5 QwQ

计费规则：按输入Token和输出Token计费。
影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token）
qwq-plus > Batch调用半价	仅思考模式	1.6元	4元
qwq-plus-latest	仅思考模式	1.6元	4元
qwq-plus-2025-03-05	仅思考模式	1.6元	4元

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token）
qwq-plus	仅思考模式	5.871元	17.614元

2.6 千问Long

计费规则：按输入Token和输出Token计费。
影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-long > Batch调用半价	0.5元	2元
qwen-long-latest	0.5元	2元
qwen-long-2025-01-25	0.5元	2元

2.7 千问Omni

计费规则：按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	文本/图片/视频输入单价（每百万Token）	音频输入单价（每百万Token）	文本 > 多模态输入输出单价（每百万Token）	文本+音频 > 仅音频计费输出单价（每百万Token）
qwen3.5-omni-plus	7元	53元	40元	213元
qwen3.5-omni-plus-2026-03-15	7元	53元	40元	213元
qwen3.5-omni-flash	2.2元	18元	13.3元	72元
qwen3.5-omni-flash-2026-03-15	2.2元	18元	13.3元	72元

更多模型

模型名称	模式	文本输入单价（每百万Token）	音频输入单价（每百万Token）	图片/视频输入单价（每百万Token）	文本 > 仅纯文本输入输出单价（每百万Token）	文本 > 多模态输入输出单价（每百万Token）	文本+音频 > 仅音频计费输出单价（每百万Token）
qwen3-omni-flash	非思考和思考模式	1.8元	15.8元	3.3元	6.9元	12.7元	62.6元
qwen3-omni-flash-2025-12-01	非思考和思考模式	1.8元	15.8元	3.3元	6.9元	12.7元	62.6元
qwen3-omni-flash-2025-09-15	非思考和思考模式	1.8元	15.8元	3.3元	6.9元	12.7元	62.6元
qwen-omni-turbo	非思考模式	0.4元	25元	1.5元	1.6元	4.5元	50元
qwen-omni-turbo-latest	非思考模式	0.4元	25元	1.5元	1.6元	4.5元	50元
qwen-omni-turbo-2025-03-26	非思考模式	0.4元	25元	1.5元	1.6元	4.5元	50元
qwen-omni-turbo-2025-01-19	非思考模式	0.4元	25元	1.5元	1.6元	4.5元	50元

模型名称	文本/图片/视频输入单价（每百万Token）	音频输入单价（每百万Token	文本 > 多模态输入输出单价（每百万Token）	文本+音频 > 仅音频计费输出单价（每百万Token）
qwen3.5-omni-plus	10.49元	82.44元	62.2元	329.74元
qwen3.5-omni-plus-2026-03-15	10.49元	82.44元	62.2元	329.74元
qwen3.5-omni-flash	3元	22.48元	16.49元	89.18元
qwen3.5-omni-flash-2026-03-15	3元	22.48元	16.49元	89.18元

更多模型

模型名称	模式	文本输入单价（每百万Token）	音频输入单价（每百万Token）	图片/视频输入单价（每百万Token）	文本>仅纯文本输入输出单价（每百万Token）	文本 > 多模态输入输出单价（每百万Token）	文本+音频 > 仅音频计费输出单价（每百万Token）
qwen3-omni-flash	非思考和思考模式	3.156元	27.962元	5.725元	12.183元	22.458元	110.896元
qwen3-omni-flash-2025-12-01	非思考和思考模式	3.156元	27.962元	5.725元	12.183元	22.458元	110.896元
qwen3-omni-flash-2025-09-15	非思考和思考模式	3.156元	27.962元	5.725元	12.183元	22.458元	110.896元
qwen-omni-turbo	非思考模式	0.514元	32.586元	1.541元	1.982元	4.624元	65.246元
qwen-omni-turbo-latest	非思考模式	0.514元	32.586元	1.541元	1.982元	4.624元	65.246元
qwen-omni-turbo-2025-03-26	非思考模式	0.514元	32.586元	1.541元	1.982元	4.624元	65.246元

2.8 千问Omni-Realtime

计费规则：按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	文本/图片输入单价（每百万Token）	音频输入单价（每百万Token）	文本 > 多模态输入输出单价（每百万Token）	文本+音频 > 仅音频计费输出单价（每百万Token）
qwen3.5-omni-plus-realtime	10元	80元	60元	300元
qwen3.5-omni-plus-realtime-2026-03-15	10元	80元	60元	300元
qwen3.5-omni-flash-realtime	3.3元	27元	20元	107元
qwen3.5-omni-flash-realtime-2026-03-15	3.3元	27元	20元	107元

模型名称	文本/图片输入单价（每百万Token）	音频输入单价（每百万Token）	文本 > 多模态输入输出单价（每百万Token）	文本+音频 > 仅音频计费输出单价（每百万Token）
qwen3.5-omni-plus-realtime	15.74元	123.65元	92.93元	464.64元
qwen3.5-omni-plus-realtime-2026-03-15	15.74元	123.65元	92.93元	464.64元
qwen3.5-omni-flash-realtime	4.12元	33.72元	24.73元	132.65元
qwen3.5-omni-flash-realtime-2026-03-15	4.12元	33.72元	24.73元	132.65元

2.9 QVQ

计费规则：按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qvq-max	8元	32元
qvq-max-latest	8元	32元
qvq-max-2025-05-15	8元	32元
qvq-max-2025-03-25	8元	32元
qvq-plus	2元	5元
qvq-plus-latest	2元	5元
qvq-plus-2025-05-15	2元	5元

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qvq-max	8.807元	35.228元
qvq-max-latest	8.807元	35.228元
qvq-max-2025-03-25	8.807元	35.228元

2.10 千问VL

计费规则：按输入Token和输出Token计费。
影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	1元	10元
qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	1.5元	15元
qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	3元	30元
qwen3-vl-plus-2025-12-19	非思考和思考模式	0<Token≤32K	1元	10元
qwen3-vl-plus-2025-12-19	非思考和思考模式	32K<Token≤128K	1.5元	15元
qwen3-vl-plus-2025-12-19	非思考和思考模式	128K<Token≤256K	3元	30元
qwen3-vl-plus-2025-09-23	非思考和思考模式	0<Token≤32K	1元	10元
qwen3-vl-plus-2025-09-23	非思考和思考模式	32K<Token≤128K	1.5元	15元
qwen3-vl-plus-2025-09-23	非思考和思考模式	128K<Token≤256K	3元	30元
qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	0.15元	1.5元
qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	0.3元	3元
qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	0.6元	6元
qwen3-vl-flash-2026-01-22	非思考和思考模式	0<Token≤32K	0.15元	1.5元
qwen3-vl-flash-2026-01-22	非思考和思考模式	32K<Token≤128K	0.3元	3元
qwen3-vl-flash-2026-01-22	非思考和思考模式	128K<Token≤256K	0.6元	6元
qwen3-vl-flash-2025-10-15	非思考和思考模式	0<Token≤32K	0.15元	1.5元
qwen3-vl-flash-2025-10-15	非思考和思考模式	32K<Token≤128K	0.3元	3元
qwen3-vl-flash-2025-10-15	非思考和思考模式	128K<Token≤256K	0.6元	6元

更多模型

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen-vl-max > Batch调用半价 > 上下文缓存享有折扣	无阶梯计价	1.6元	4元
qwen-vl-max-latest > Batch调用半价	无阶梯计价	1.6元	4元
qwen-vl-max-2025-08-13	无阶梯计价	1.6元	4元
qwen-vl-max-2025-04-08	无阶梯计价	3元	9元
qwen-vl-max-2025-04-02	无阶梯计价	3元	9元
qwen-vl-max-2025-01-25	无阶梯计价	3元	9元
qwen-vl-max-2024-12-30	无阶梯计价	3元	9元
qwen-vl-max-2024-11-19	无阶梯计价	3元	9元
qwen-vl-plus > Batch调用半价 > 上下文缓存享有折扣	无阶梯计价	0.8元	2元
qwen-vl-plus-latest > Batch调用半价	无阶梯计价	0.8元	2元
qwen-vl-plus-2025-08-15	无阶梯计价	0.8元	2元
qwen-vl-plus-2025-07-10	无阶梯计价	0.15元	1.5元
qwen-vl-plus-2025-05-07	无阶梯计价	1.5元	4.5元
qwen-vl-plus-2025-01-25	无阶梯计价	1.5元	4.5元
qwen-vl-plus-2025-01-02	无阶梯计价	1.5元	4.5元

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3-vl-plus > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	1元	10元
qwen3-vl-plus > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	1.5元	15元
qwen3-vl-plus > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	3元	30元
qwen3-vl-plus-2025-09-23	非思考和思考模式	0<Token≤32K	1元	10元
qwen3-vl-plus-2025-09-23	非思考和思考模式	32K<Token≤128K	1.5元	15元
qwen3-vl-plus-2025-09-23	非思考和思考模式	128K<Token≤256K	3元	30元
qwen3-vl-flash > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	0.15元	1.5元
qwen3-vl-flash > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	0.3元	3元
qwen3-vl-flash > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	0.6元	6元
qwen3-vl-flash-2025-10-15	非思考和思考模式	0<Token≤32K	0.15元	1.5元
qwen3-vl-flash-2025-10-15	非思考和思考模式	32K<Token≤128K	0.3元	3元
qwen3-vl-flash-2025-10-15	非思考和思考模式	128K<Token≤256K	0.6元	6元

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-vl-plus > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	1.468元	11.743元
qwen3-vl-plus > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	2.202元	17.614元
qwen3-vl-plus > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	4.404元	35.228元
qwen3-vl-plus-2025-12-19	非思考和思考模式	0<Token≤32K	1.468元	11.743元
qwen3-vl-plus-2025-12-19	非思考和思考模式	32K<Token≤128K	2.202元	17.614元
qwen3-vl-plus-2025-12-19	非思考和思考模式	128K<Token≤256K	4.404元	35.228元
qwen3-vl-plus-2025-09-23	非思考和思考模式	0<Token≤32K	1.468元	11.743元
qwen3-vl-plus-2025-09-23	非思考和思考模式	32K<Token≤128K	2.202元	17.614元
qwen3-vl-plus-2025-09-23	非思考和思考模式	128K<Token≤256K	4.404元	35.228元
qwen3-vl-flash > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	0.367元	2.936元
qwen3-vl-flash > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	0.55元	4.404元
qwen3-vl-flash > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	0.881元	7.046元
qwen3-vl-flash-2026-01-22	非思考和思考模式	0<Token≤32K	0.367元	2.936元
qwen3-vl-flash-2026-01-22	非思考和思考模式	32K<Token≤128K	0.55元	4.404元
qwen3-vl-flash-2026-01-22	非思考和思考模式	128K<Token≤256K	0.881元	7.046元
qwen3-vl-flash-2025-10-15	非思考和思考模式	0<Token≤32K	0.367元	2.936元
qwen3-vl-flash-2025-10-15	非思考和思考模式	32K<Token≤128K	0.55元	4.404元
qwen3-vl-flash-2025-10-15	非思考和思考模式	128K<Token≤256K	0.881元	7.046元

更多模型

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen-vl-max > 上下文缓存享有折扣	无阶梯计价	5.871元	23.486元
qwen-vl-max-latest	无阶梯计价	5.871元	23.486元
qwen-vl-max-2025-08-13	无阶梯计价	5.871元	23.486元
qwen-vl-max-2025-04-08	无阶梯计价	5.871元	23.486元
qwen-vl-plus > 上下文缓存享有折扣	无阶梯计价	1.541元	4.624元
qwen-vl-plus-latest	无阶梯计价	1.541元	4.624元
qwen-vl-plus-2025-08-15	无阶梯计价	1.541元	4.624元
qwen-vl-plus-2025-05-07	无阶梯计价	1.541元	4.624元
qwen-vl-plus-2025-01-25	无阶梯计价	1.541元	4.624元

4. 美国
服务部署范围为美国时，模型推理计算资源仅限于美国境内；静态数据存储于您所选的地域。该部署范围支持的地域：美国（弗吉尼亚）。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3-vl-flash-us > 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	0.367元	2.936元
qwen3-vl-flash-us > 上下文缓存享有折扣	非思考和思考模式	32K<Token≤128K	0.55元	4.404元
qwen3-vl-flash-us > 上下文缓存享有折扣	非思考和思考模式	128K<Token≤256K	0.881元	7.046元
qwen3-vl-flash-2025-10-15-us	非思考和思考模式	0<Token≤32K	0.367元	2.936元
qwen3-vl-flash-2025-10-15-us	非思考和思考模式	32K<Token≤128K	0.55元	4.404元
qwen3-vl-flash-2025-10-15-us	非思考和思考模式	128K<Token≤256K	0.881元	7.046元

4. 欧盟
服务部署范围为欧盟时，模型推理计算资源仅限于欧盟境内；静态数据存储于您所选的地域。该部署范围支持的地域：德国（法兰克福）。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3-vl-plus	非思考和思考模式	0<Token≤32K	1.499元	11.991元
qwen3-vl-plus	非思考和思考模式	32K<Token≤128K	2.248元	17.986元
qwen3-vl-plus	非思考和思考模式	128K<Token≤256K	4.497元	35.972元
qwen3-vl-flash	非思考和思考模式	0<Token≤32K	0.375元	2.998元
qwen3-vl-flash	非思考和思考模式	32K<Token≤128K	0.562元	4.497元
qwen3-vl-flash	非思考和思考模式	128K<Token≤256K	0.899元	7.194元
qwen3-vl-flash-2025-10-15	非思考和思考模式	0<Token≤32K	0.375元	2.998元
qwen3-vl-flash-2025-10-15	非思考和思考模式	32K<Token≤128K	0.562元	4.497元
qwen3-vl-flash-2025-10-15	非思考和思考模式	128K<Token≤256K	0.899元	7.194元

2.11 千问OCR

计费规则：按输入Token和输出Token计费。
影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-vl-ocr > Batch调用半价	0.3元	0.5元
qwen-vl-ocr-latest > Batch调用半价	0.3元	0.5元
qwen-vl-ocr-2025-11-20	0.3元	0.5元
qwen-vl-ocr-2025-08-28	5元	5元
qwen-vl-ocr-2025-04-13	5元	5元
qwen-vl-ocr-2024-10-28	5元	5元

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-vl-ocr	0.3元	0.5元
qwen-vl-ocr-2025-11-20	0.3元	0.5元

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-vl-ocr	0.514元	1.174元
qwen-vl-ocr-2025-11-20	0.514元	1.174元

2.12 千问Audio

说明：服务部署范围仅支持中国内地。数据存储位于北京接入地域，模型推理计算资源仅限于中国内地。
计费规则：按输入Token和输出Token计费。
音频Token计算规则：每一秒钟的音频对应25个Token。若音频时长不足1秒，则按25个Token计算。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度
qwen-audio-turbo	目前仅供免费体验。	免费额度用完后不可调用，推荐使用全模态（Qwen-Omni）作为替代模型	各10万Token 有效期：阿里云百炼开通后90天内
qwen-audio-turbo-latest	目前仅供免费体验。	免费额度用完后不可调用，推荐使用全模态（Qwen-Omni）作为替代模型	各10万Token 有效期：阿里云百炼开通后90天内

2.13 千问数学模型

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度
qwen-math-plus	4元	12元	各100万Token 有效期：阿里云百炼开通后90天内
qwen-math-turbo	2元	6元	各100万Token 有效期：阿里云百炼开通后90天内

2.14 千问Coder

计费规则：按输入Token和输出Token计费。

影响计费的因素：若模型支持上下文缓存，仅输入Token享有折扣。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-plus > 上下文缓存享有折扣	0<Token≤32K	4元	16元
qwen3-coder-plus > 上下文缓存享有折扣	32K<Token≤128K	6元	24元
qwen3-coder-plus > 上下文缓存享有折扣	128K<Token≤256K	10元	40元
qwen3-coder-plus > 上下文缓存享有折扣	256K<Token≤1M	20元	200元
qwen3-coder-plus-2025-09-23	0<Token≤32K	4元	16元
qwen3-coder-plus-2025-09-23	32K<Token≤128K	6元	24元
qwen3-coder-plus-2025-09-23	128K<Token≤256K	10元	40元
qwen3-coder-plus-2025-09-23	256K<Token≤1M	20元	200元
qwen3-coder-plus-2025-07-22	0<Token≤32K	4元	16元
qwen3-coder-plus-2025-07-22	32K<Token≤128K	6元	24元
qwen3-coder-plus-2025-07-22	128K<Token≤256K	10元	40元
qwen3-coder-plus-2025-07-22	256K<Token≤1M	20元	200元
qwen3-coder-flash	0<Token≤32K	1元	4元
qwen3-coder-flash	32K<Token≤128K	1.5元	6元
qwen3-coder-flash	128K<Token≤256K	2.5元	10元
qwen3-coder-flash	256K<Token≤1M	5元	25元
qwen3-coder-flash-2025-07-28	0<Token≤32K	1元	4元
qwen3-coder-flash-2025-07-28	32K<Token≤128K	1.5元	6元
qwen3-coder-flash-2025-07-28	128K<Token≤256K	2.5元	10元
qwen3-coder-flash-2025-07-28	256K<Token≤1M	5元	25元

更多模型

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen-coder-plus	无阶梯计价	3.5元	7元
qwen-coder-plus-latest	无阶梯计价	3.5元	7元
qwen-coder-plus-2024-11-06	无阶梯计价	3.5元	7元
qwen-coder-turbo	无阶梯计价	2元	6元
qwen-coder-turbo-latest	无阶梯计价	2元	6元
qwen-coder-turbo-2024-09-19	无阶梯计价	2元	6元

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-plus	0<Token≤32K	4元	16元
qwen3-coder-plus	32K<Token≤128K	6元	24元
qwen3-coder-plus	128K<Token≤256K	10元	40元
qwen3-coder-plus	256K<Token≤1M	20元	200元
qwen3-coder-plus-2025-09-23	0<Token≤32K	4元	16元
qwen3-coder-plus-2025-09-23	32K<Token≤128K	6元	24元
qwen3-coder-plus-2025-09-23	128K<Token≤256K	10元	40元
qwen3-coder-plus-2025-09-23	256K<Token≤1M	20元	200元
qwen3-coder-plus-2025-07-22	0<Token≤32K	4元	16元
qwen3-coder-plus-2025-07-22	32K<Token≤128K	6元	24元
qwen3-coder-plus-2025-07-22	128K<Token≤256K	10元	40元
qwen3-coder-plus-2025-07-22	256K<Token≤1M	20元	200元
qwen3-coder-flash	0<Token≤32K	1元	4元
qwen3-coder-flash	32K<Token≤128K	1.5元	6元
qwen3-coder-flash	128K<Token≤256K	2.5元	10元
qwen3-coder-flash	256K<Token≤1M	5元	25元
qwen3-coder-flash-2025-07-28	0<Token≤32K	1元	4元
qwen3-coder-flash-2025-07-28	32K<Token≤128K	1.5元	6元
qwen3-coder-flash-2025-07-28	128K<Token≤256K	2.5元	10元
qwen3-coder-flash-2025-07-28	256K<Token≤1M	5元	25元

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-plus	0<Token≤32K	7.339元	36.696元
qwen3-coder-plus	32K<Token≤128K	13.211元	66.053元
qwen3-coder-plus	128K<Token≤256K	22.018元	110.089元
qwen3-coder-plus	256K<Token≤1M	44.035元	440.354元
qwen3-coder-plus-2025-09-23	0<Token≤32K	7.339元	36.696元
qwen3-coder-plus-2025-09-23	32K<Token≤128K	13.211元	66.053元
qwen3-coder-plus-2025-09-23	128K<Token≤256K	22.018元	110.089元
qwen3-coder-plus-2025-09-23	256K<Token≤1M	44.035元	440.354元
qwen3-coder-plus-2025-07-22	0<Token≤32K	7.339元	36.696元
qwen3-coder-plus-2025-07-22	32K<Token≤128K	13.211元	66.053元
qwen3-coder-plus-2025-07-22	128K<Token≤256K	22.018元	110.089元
qwen3-coder-plus-2025-07-22	256K<Token≤1M	44.035元	440.354元
qwen3-coder-flash	0<Token≤32K	2.202元	11.009元
qwen3-coder-flash	32K<Token≤128K	3.67元	18.348元
qwen3-coder-flash	128K<Token≤256K	5.871元	29.357元
qwen3-coder-flash	256K<Token≤1M	11.743元	70.457元
qwen3-coder-flash-2025-07-28	0<Token≤32K	2.202元	11.009元
qwen3-coder-flash-2025-07-28	32K<Token≤128K	3.67元	18.348元
qwen3-coder-flash-2025-07-28	128K<Token≤256K	5.871元	29.357元
qwen3-coder-flash-2025-07-28	256K<Token≤1M	11.743元	70.457元

2.15 千问翻译模型

计费规则：按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

| 模型名称 | 输入单价（每百万Token） | 输出单价（每百万Token） |
| --- | --- | --- | --- |
| qwen-mt-plus | 1.8元 | 5.4元 |
| qwen-mt-flash | 0.7元 | 1.95元 |
| qwen-mt-lite | 0.6元 | 1.6元 |
| qwen-mt-turbo | 0.7元 | 1.95元 |

2. 全球

服务部署范围为全球时，模型推理计算资源在全球范围内动态调度；静态数据存储于您所选的地域。该部署范围支持的地域：美国（弗吉尼亚）、德国（法兰克福）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-mt-plus	1.8元	5.4元
qwen-mt-flash	0.7元	1.95元
qwen-mt-lite	0.6元	1.6元

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-mt-plus	18.055元	54.09元
qwen-mt-flash	1.174元	3.596元
qwen-mt-lite	0.881元	2.642元
qwen-mt-turbo	1.174元	3.596元

4. 美国

服务部署范围为美国时，模型推理计算资源仅限于美国境内；静态数据存储于您所选的地域。该部署范围支持的地域：美国（弗吉尼亚）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-mt-lite-us	0.881元	2.642元

2.16 千问数据挖掘模型

说明：服务部署范围仅支持中国内地。数据存储位于北京接入地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度
qwen-doc-turbo	0.6元	1元	无免费额度

2.17 千问深入研究模型

说明：服务部署范围仅支持中国内地。数据存储位于北京接入地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

| 模型名称 | 输入单价（每百万Token） | 输出单价（每百万Token） | 免费额度|
| --- | --- | --- |
| qwen-deep-research | 54元 | 163元 | 无免费额度 |

2.18 通义晓蜜对话分析模型

说明：服务部署范围仅支持中国内地。数据存储位于北京接入地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
tongyi-xiaomi-analysis-flash	0.2元	0.4元
tongyi-xiaomi-analysis-pro	1.0元	2.7元

3、文本生成-千问-开源版

3.1 Qwen3.6

计费规则：按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3.6-35b-a3b	0<Token≤256K	1.8元	10.8元	10.8元
qwen3.6-27b	0<Token≤256K	3元	18元	18元

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
非思考模式	思考模式（思维链+回答）
qwen3.6-35b-a3b	0<Token≤256K	1.8元	10.8元	10.8元

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3.6-35b-a3b	0<Token≤256K	2.810325元	16.86195元	16.86195元
qwen3.6-27b	0<Token≤256K	4.49652元	26.97912元	26.97912元

3.2 Qwen3.5

计费规则：按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3.5-397b-a17b	0<Token≤128K	1.2元	7.2元	7.2元
qwen3.5-397b-a17b	128K<Token≤256K	3元	18元	18元
qwen3.5-122b-a10b	0<Token≤128K	0.8元	6.4元	6.4元
qwen3.5-122b-a10b	128K<Token≤256K	2元	16元	16元
qwen3.5-27b	0<Token≤128K	0.6元	4.8元	4.8元
qwen3.5-27b	128K<Token≤256K	1.8元	14.4元	14.4元
qwen3.5-35b-a3b	0<Token≤128K	0.4元	3.2元	3.2元
qwen3.5-35b-a3b	128K<Token≤256K	1.6元	12.8元	12.8元

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3.5-397b-a17b	0<Token≤128K	1.2元	7.2元	7.2元
qwen3.5-397b-a17b	128K<Token≤256K	3元	18元	18元
qwen3.5-122b-a10b	0<Token≤128K	0.8元	6.4元	6.4元
qwen3.5-122b-a10b	128K<Token≤256K	2元	16元	16元
qwen3.5-27b	0<Token≤128K	0.6元	4.8元	4.8元
qwen3.5-27b	128K<Token≤256K	1.8元	14.4元	14.4元
qwen3.5-35b-a3b	0<Token≤128K	0.4元	3.2元	3.2元
qwen3.5-35b-a3b	128K<Token≤256K	1.6元	12.8元	12.8元

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3.5-397b-a17b	0<Token≤256K	4.404元	26.421元	26.421元
qwen3.5-122b-a10b	0<Token≤256K	2.936元	23.486元	23.486元
qwen3.5-27b	0<Token≤256K	2.202元	17.614元	17.614元
qwen3.5-35b-a3b	0<Token≤256K	1.835元	14.678元	14.678元

3.3 Qwen3

计费规则：按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	模式	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3-next-80b-a3b-thinking	仅思考模式	1元	\-	10元
qwen3-next-80b-a3b-instruct	仅非思考模式	1元	4元	\-
qwen3-235b-a22b-thinking-2507	仅思考模式	2元	\-	20元
qwen3-235b-a22b-instruct-2507	仅非思考模式	2元	8元	\-
qwen3-30b-a3b-thinking-2507	仅思考模式	0.75元	\-	7.5元
qwen3-30b-a3b-instruct-2507	仅非思考模式	0.75元	3元	\-
qwen3-235b-a22b	非思考和思考模式	2元	8元	20元
qwen3-32b	非思考和思考模式	2元	8元	20元
qwen3-30b-a3b	非思考和思考模式	0.75元	3元	7.5元
qwen3-14b	非思考和思考模式	1元	4元	10元
qwen3-8b	非思考和思考模式	0.5元	2元	5元
qwen3-4b	非思考和思考模式	0.3元	1.2元	3元
qwen3-1.7b	非思考和思考模式	0.3元	1.2元	3元
qwen3-0.6b	非思考和思考模式	0.3元	1.2元	3元

模型名称	模式	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3-next-80b-a3b-thinking	仅思考模式	1元	\-	10元
qwen3-next-80b-a3b-instruct	仅非思考模式	1元	4元	\-
qwen3-235b-a22b-thinking-2507	仅思考模式	1.688元	\-	16.88元
qwen3-235b-a22b-instruct-2507	仅非思考模式	1.688元	6.752元	\-
qwen3-30b-a3b-thinking-2507	仅思考模式	0.75元	\-	7.5元
qwen3-30b-a3b-instruct-2507	仅非思考模式	0.75元	3元	\-
qwen3-235b-a22b	非思考和思考模式	2元	8元	20元
qwen3-32b	非思考和思考模式	1.174元	4.697元	4.697元
qwen3-30b-a3b	非思考和思考模式	0.75元	3元	7.5元
qwen3-14b	非思考和思考模式	1元	4元	10元
qwen3-8b	非思考和思考模式	0.5元	2元	5元

模型名称	模式	输入单价（每百万Token）	非思考模式输出单价（每百万Token）	思考模式（思维链+回答）输出单价（每百万Token）
qwen3-next-80b-a3b-thinking	仅思考模式	1.101元	\-	8.807元
qwen3-next-80b-a3b-instruct	仅非思考模式	1.101元	8.807元	\-
qwen3-235b-a22b-thinking-2507	仅思考模式	1.688元	\-	16.88元
qwen3-235b-a22b-instruct-2507	仅非思考模式	1.688元	6.752元	\-
qwen3-30b-a3b-thinking-2507	仅思考模式	1.468元	\-	17.614元
qwen3-30b-a3b-instruct-2507	仅非思考模式	1.468元	5.871元	\-
qwen3-235b-a22b	非思考和思考模式	5.137元	20.55元	61.65元
qwen3-32b	非思考和思考模式	1.174元	4.697元	4.697元
qwen3-30b-a3b	非思考和思考模式	1.468元	5.871元	17.614元
qwen3-14b	非思考和思考模式	2.569元	10.275元	30.825元
qwen3-8b	非思考和思考模式	1.321元	5.137元	15.412元
qwen3-4b	非思考和思考模式	0.807元	3.082元	9.247元
qwen3-1.7b	非思考和思考模式	0.807元	3.082元	9.247元
qwen3-0.6b	非思考和思考模式	0.807元	3.082元	9.247元

3.4 QwQ-开源版

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwq-32b	2元	6元

3.5 QwQ-Preview

计费规则：按输入Token和输出Token计费。

影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwq-32b-preview > Batch调用半价	2元	6元

3.6 Qwen2.5

计费规则：按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen2.5-14b-instruct-1m	1元	3元
qwen2.5-7b-instruct-1m	0.5元	1元
qwen2.5-72b-instruct	4元	12元
qwen2.5-32b-instruct	2元	6元
qwen2.5-14b-instruct	1元	3元
qwen2.5-7b-instruct	0.5元	1元
qwen2.5-3b-instruct	0.3元	0.9元

说明：国际（新加坡）模型无免费额度。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen2.5-14b-instruct-1m	5.908元	23.632元
qwen2.5-7b-instruct-1m	2.701元	10.789元
qwen2.5-72b-instruct	10.275元	41.1元
qwen2.5-32b-instruct	5.137元	20.55元
qwen2.5-14b-instruct	2.569元	10.275元
qwen2.5-7b-instruct	1.284元	5.137元

3.7 QVQ

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qvq-72b-preview	12元	36元

3.8 Qwen-Omni

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	文本输入单价（每百万Token）	音频输入单价（每百万Token）	图片/视频输入单价（每百万Token）	文本 > 仅纯文本输入输出单价（每百万Token）	文本 > 多模态输入输出单价（每百万Token）	文本+音频 > 仅音频计费输出单价（每百万Token）
qwen2.5-omni-7b	0.6元	38元	2元	2.4元	6元	76元

模型名称	文本输入单价（每百万Token）	音频输入单价（每百万Token）	图片/视频输入单价（每百万Token）	文本 > 仅纯文本输入输出单价（每百万Token）	文本 > 多模态输入输出单价（每百万Token）	文本+音频 > 仅音频计费输出单价（每百万Token）
qwen2.5-omni-7b	0.734元	49.613元	2.055元	2.936元	6.165元	99.153元

3.9 Qwen3-Omni-Captioner

计费规则：按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-omni-30b-a3b-captioner	15.8元	12.7元

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-omni-30b-a3b-captioner	27.962元	22.458元

3.10 Qwen-VL

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3-vl-235b-a22b-thinking	仅思考模式	2元	20元
qwen3-vl-235b-a22b-instruct	仅非思考模式	2元	8元
qwen3-vl-32b-thinking	仅思考模式	2元	20元
qwen3-vl-32b-instruct	仅非思考模式	2元	8元
qwen3-vl-30b-a3b-thinking	仅思考模式	0.75元	7.5元
qwen3-vl-30b-a3b-instruct	仅非思考模式	0.75元	3元
qwen3-vl-8b-thinking	仅思考模式	0.5元	5元
qwen3-vl-8b-instruct	仅非思考模式	0.5元	2元

更多模型

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen2.5-vl-72b-instruct	16元	48元
qwen2.5-vl-32b-instruct	8元	24元
qwen2.5-vl-7b-instruct	2元	5元
qwen2.5-vl-3b-instruct	1.2元	3.6元

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3-vl-235b-a22b-thinking	仅思考模式	2元	20元
qwen3-vl-235b-a22b-instruct	仅非思考模式	2元	8元
qwen3-vl-32b-thinking	仅思考模式	1.174元	4.697元
qwen3-vl-32b-instruct	仅非思考模式	1.174元	4.697元
qwen3-vl-30b-a3b-thinking	仅思考模式	0.75元	7.5元
qwen3-vl-30b-a3b-instruct	仅非思考模式	0.75元	3元
qwen3-vl-8b-thinking	仅思考模式	0.5元	5元
qwen3-vl-8b-instruct	仅非思考模式	0.5元	2元

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
qwen3-vl-235b-a22b-thinking	仅思考模式	2.936元	29.357元
qwen3-vl-235b-a22b-instruct	仅非思考模式	2.936元	11.743元
qwen3-vl-32b-thinking	仅思考模式	1.174元	4.697元
qwen3-vl-32b-instruct	仅非思考模式	1.174元	4.697元
qwen3-vl-30b-a3b-thinking	仅思考模式	1.468元	17.614元
qwen3-vl-30b-a3b-instruct	仅非思考模式	1.468元	5.871元
qwen3-vl-8b-thinking	仅思考模式	1.321元	15.412元
qwen3-vl-8b-instruct	仅非思考模式	1.321元	5.137元

3.12 Qwen-Math

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen2.5-math-72b-instruct	4元	12元
qwen2.5-math-7b-instruct	1元	2元

3.13 Qwen-Coder

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

| 模型名称 | 单次请求的输入Token数 | 输入单价（每百万Token） | 输出单价（每百万Token） |
| --- | --- | --- | --- | --- |
| qwen3-coder-next | 0<Token≤32K | 1元 | 4元 |
| qwen3-coder-next | 32K<Token≤128K | 1.5元 | 6元 |
| qwen3-coder-next | 128K<Token≤256K | 2.5元 | 10元 |
| qwen3-coder-480b-a35b-instruct | 0<Token≤32K | 6元 | 24元 |
| qwen3-coder-480b-a35b-instruct| 32K<Token≤128K | 9元 | 36元 |
| qwen3-coder-480b-a35b-instruct| 128K<Token≤200K | 15元 | 60元 |
| qwen3-coder-30b-a3b-instruct | 0<Token≤32K | 1.5元 | 6元 |
| qwen3-coder-30b-a3b-instruct | 32K<Token≤128K | 2.25元 | 9元 |
| qwen3-coder-30b-a3b-instruct | 128K<Token≤200K | 3.75元 | 15元 |
| qwen2.5-coder-32b-instruct | 无阶梯计价 | 2元 | 6元 |
| qwen2.5-coder-14b-instruct | 无阶梯计价 | 2元 | 6元 |
| qwen2.5-coder-7b-instruct | 无阶梯计价 | 1元 | 2元 |

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-480b-a35b-instruct	0<Token≤32K	6元	24元
qwen3-coder-480b-a35b-instruct	32K<Token≤128K	9元	36元
qwen3-coder-480b-a35b-instruct	128K<Token≤200K	15元	60元
qwen3-coder-30b-a3b-instruct	0<Token≤32K	1.5元	6元
qwen3-coder-30b-a3b-instruct	32K<Token≤128K	2.25元	9元
qwen3-coder-30b-a3b-instruct	128K<Token≤200K	3.75元	15元

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-next	0<Token≤32K	2.202元	11.009元
qwen3-coder-next	32K<Token≤128K	3.67元	18.348元
qwen3-coder-next	128K<Token≤256K	5.871元	29.357元
qwen3-coder-480b-a35b-instruct	0<Token≤32K	11.009元	55.044元
qwen3-coder-480b-a35b-instruct	32K<Token≤128K	19.816元	99.08元
qwen3-coder-480b-a35b-instruct	128K<Token≤200K	33.027元	165.133元
qwen3-coder-30b-a3b-instruct	0<Token≤32K	3.303元	16.513元
qwen3-coder-30b-a3b-instruct	32K<Token≤128K	5.504元	27.522元
qwen3-coder-30b-a3b-instruct	128K<Token≤200K	8.807元	44.035元

4. 欧盟
服务部署范围为欧盟时，模型推理计算资源仅限于欧盟境内；静态数据存储于您所选的地域。该部署范围支持的地域：德国（法兰克福）。

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-next	0<Token≤32K	2.248元	11.241元
qwen3-coder-next	32K<Token≤128K	3.747元	18.736元
qwen3-coder-next	128K<Token≤256K	5.995元	29.977元

4、文本生成-第三方模型

4.1 DeepSeek

计费规则：按输入Token和输出Token计费。
影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
deepseek-v4-pro > 上下文缓存享有折扣	12元	24元
deepseek-v4-flash > 上下文缓存享有折扣	1元	2元
deepseek-v3.2 > 上下文缓存享有折扣	2元	3元
deepseek-v3.2-exp	2元	3元
deepseek-v3.1	4元	12元
deepseek-r1 > Batch调用半价	4元	16元
deepseek-r1-0528	4元	16元
deepseek-v3 > Batch调用半价	2元	8元
deepseek-r1-distill-qwen-1.5b	限时免费	限时免费
deepseek-r1-distill-qwen-7b	0.5元	1元
deepseek-r1-distill-qwen-14b	1元	3元
deepseek-r1-distill-qwen-32b	2元	6元
deepseek-r1-distill-llama-8b	限时免费	限时免费

模型名称	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
deepseek-v4-pro > 上下文缓存享有折扣	12元	24元
deepseek-v4-flash > 上下文缓存享有折扣	1元	2元

模型名称	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
deepseek-v3.2 > 上下文缓存享有折扣	4.272元	12.815元

4.2 DeepSeek-硅基流动

说明：服务部署范围仅支持中国内地。

模型名称	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
siliconflow/deepseek-v3.2	2元	3元
siliconflow/deepseek-v3.1-terminus	4元	12元
siliconflow/deepseek-r1-0528	4元	16元
siliconflow/deepseek-v3-0324	2元	8元

4.3 DeepSeek-快手万擎

模型名称	输入单价（每百万Token）	输出单价（每百万Token） > 思维链+回答
vanchin/deepseek-v3.2-think > 上下文缓存享有折扣	2元	3元
vanchin/deepseek-v3.1-terminus > 上下文缓存享有折扣	4元	12元
vanchin/deepseek-r1 > 上下文缓存享有折扣	4元	16元
vanchin/deepseek-v3 > 上下文缓存享有折扣	2元	8元
vanchin/deepseek-ocr	0.216元	0.216元

4.4 Kimi

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token）
kimi-k2.6	非思考和思考模式	6.5元	27元
kimi-k2.5	非思考和思考模式	4元	21元
kimi-k2-thinking	仅思考模式	4元	16元
Moonshot-Kimi-K2-Instruct	非思考模式	4元	16元

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token）
kimi-k2.5	非思考和思考模式	4元	21元

4.5 Kimi-月之暗面

模型名称	输入单价（每百万Token）	输出单价（每百万Token） > 思维链和回答
kimi/kimi-k2.6 > 上下文缓存享有折扣	6.5元	27元
kimi/kimi-k2.5 > 上下文缓存享有折扣	4元	21元

4.6 GLM

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token） > 思维链和回答
glm-5.1	非思考和思考模式	0<Token≤32K	6元	24元
glm-5.1	非思考和思考模式	32K<Token≤200K	8元	28元
glm-5	非思考和思考模式	0<Token≤32K	4元	18元
glm-5	非思考和思考模式	32K<Token≤198K	6元	22元
glm-4.7	非思考和思考模式	0<Token≤32K	3元	14元
glm-4.7	非思考和思考模式	32K<Token≤166K	4元	16元
glm-4.6	非思考和思考模式	0<Token≤32K	3元	14元
glm-4.6	非思考和思考模式	32K<Token≤166K	4元	16元
glm-4.5	非思考和思考模式	0<Token≤32K	3元	14元
glm-4.5	非思考和思考模式	32K<Token≤96K	4元	16元
glm-4.5-air	非思考和思考模式	0<Token≤32K	0.8元	6元
glm-4.5-air	非思考和思考模式	32K<Token≤96K	1.2元	8元

4.7 MiniMax

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token） > 思维链和回答
MiniMax-M2.5	仅思考模式	2.1元	8.4元
MiniMax-M2.1	仅思考模式	2.1元	8.4元

4.8 MiniMax-稀宇科技

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token） > 思维链和回答
MiniMax/MiniMax-M2.7 > 上下文缓存享有折扣	仅思考模式	2.1元	8.4元
MiniMax/MiniMax-M2.5 > 上下文缓存享有折扣	仅思考模型	2.1元	8.4元
MiniMax/MiniMax-M2.1 > 上下文缓存享有折扣	仅思考模式	2.1元	8.4元

5、图像生成

计费规则：输入不计费，输出计费。输出按成功生成的图像张数计费。
计费公式：费用 = 图像单价 × 输出的图像张数。

计费说明：

费用与输出图像的分辨率、宽高比无关。
请求失败不产生任何费用，也不消耗免费额度。

计费示例：部分图像生成失败
假设图像单价为 0.10元/张。若您调用接口请求生成 4 张图像，但实际仅成功返回 3 张图像的 URL，另 1 张生成失败，系统将仅对成功生成的图像进行计费。

计费数量：3 张。
费用计算：0.1 × 3 = 0.3元。

5.1 千问文生图

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	输出单价
qwen-image-2.0-pro	0.5元/张
qwen-image-2.0-pro-2026-04-22	0.5元/张
qwen-image-2.0-pro-2026-03-03	0.5元/张
qwen-image-2.0	0.2元/张
qwen-image-2.0-2026-03-03	0.2元/张
qwen-image-max	0.5元/张
qwen-image-max-2025-12-30	0.5元/张
qwen-image-plus	0.2元/张
qwen-image-plus-2026-01-09	0.2元/张
qwen-image	0.25元/张

2. 国际

模型名称	输出单价
qwen-image-2.0-pro	0.550443元/张
qwen-image-2.0-pro-2026-04-22	0.550443元/张
qwen-image-2.0-pro-2026-03-03	0.550443元/张
qwen-image-2.0	0.256873元/张
qwen-image-2.0-2026-03-03	0.256873元/张
qwen-image-max	0.550443元/张
qwen-image-max-2025-12-30	0.550443元/张
qwen-image-plus	0.220177元/张
qwen-image-plus-2026-01-09	0.220177元/张
qwen-image	0.256873元/张

5.2 千问图像编辑

1. 中国内地
服务部署范围为中国内地时，模型推理计算资源仅限于中国内地；静态数据存储于您所选的地域。该部署范围支持的地域：华北2（北京）。

模型名称	输出单价
qwen-image-2.0-pro	0.5元/张
qwen-image-2.0-pro-2026-04-22	0.5元/张
qwen-image-2.0-pro-2026-03-03	0.5元/张
qwen-image-2.0	0.2元/张
qwen-image-2.0-2026-03-03	0.2元/张
qwen-image-edit-max	0.5元/张
qwen-image-edit-max-2026-01-16	0.5元/张
qwen-image-edit-plus	0.2元/张
qwen-image-edit-plus-2025-12-15	0.2元/张
qwen-image-edit-plus-2025-10-30	0.2元/张
qwen-image-edit	0.3元/张

2. 国际

模型名称	输出单价
qwen-image-2.0-pro	0.550443元/张
qwen-image-2.0-pro-2026-04-22	0.550443元/张
qwen-image-2.0-pro-2026-03-03	0.550443元/张
qwen-image-2.0	0.256873元/张
qwen-image-2.0-2026-03-03	0.256873元/张
qwen-image-edit-max	0.550443元/张
qwen-image-edit-max-2026-01-16	0.550443元/张
qwen-image-edit-plus	0.220177元/张
qwen-image-edit-plus-2025-12-15	0.220177元/张
qwen-image-edit-plus-2025-10-30	0.220177元/张
qwen-image-edit	0.330266元/张

5.3 千问图像翻译

模型名称	输出单价
qwen-mt-image	0.003元/张

5.4 Z-Image

1. 中国内地

模型名称	输出单价
z-image-turbo	关闭提示词改写（`prompt_extend=false`）：0.1元/张开启提示词改写（`prompt_extend=true`）：0.2元/张

模型名称	输出单价
z-image-turbo	关闭提示词改写（`prompt_extend=false`）：0.110089元/张开启提示词改写（`prompt_extend=true`）：0.220177元/张

5.5 万相文生图

1. 中国内地

模型名称	输出单价
wan2.6-t2i	0.20元/张
wan2.5-t2i-preview	0.20元/张
wan2.2-t2i-plus	0.20元/张
wan2.2-t2i-flash	0.14元/张
wanx2.1-t2i-plus	0.20元/张
wanx2.1-t2i-turbo	0.14元/张
wanx2.0-t2i-turbo	0.04元/张
wanx-v1	0.16元/张

2. 全球

模型名称	输出单价
wan2.6-t2i	0.20元/张

3. 国际

模型名称	输出单价
wan2.6-t2i	0.220177元/张
wan2.5-t2i-preview	0.220177元/张
wan2.2-t2i-plus	0.366962元/张
wan2.2-t2i-flash	0.183481元/张
wan2.1-t2i-plus	0.366962元/张
wan2.1-t2i-turbo	0.183481元/张

5.6 万相图像生成与编辑

1. 中国内地

模型名称	输出单价
wan2.7-image-pro	0.50元/张
wan2.7-image	0.20元/张
wan2.6-image	0.20元/张

2. 全球

模型名称	输出单价
wan2.6-image	0.20元/张

3. 国际

模型名称	输出单价
wan2.7-image-pro	0.562065元/张
wan2.7-image	0.220177元/张
wan2.6-image	0.220177元/张

5.7 万相通用图像编辑

1. 中国内地

模型名称	输出单价
wan2.5-i2i-preview	0.20元/张	50张
wanx2.1-imageedit	0.14元/张	500张

2. 国际

模型名称	输出单价
wan2.5-i2i-preview	0.220177元/张

5.8 万相涂鸦作画

模型名称	输出单价
wanx-sketch-to-image-lite	0.06元/张

5.9 万相图像局部重绘

模型名称	输出单价
wanx-x-painting	目前仅供免费体验。 > 免费额度用完后不可调用

5.10 人像风格重绘

模型名称	输出单价
wanx-style-repaint-v1	0.12元/张

5.11 图像背景生成

模型名称	输出单价
wanx-background-generation-v2	0.08元/张

5.12 图像画面扩展

模型名称	输出单价
image-out-painting	0.18元/张

5.13 人物实例分割

模型名称	输出单价
image-instance-segmentation	目前仅供免费体验。 > 免费额度用完后不可调用。

5.14 图像擦除补全

模型名称	输出单价
image-erase-completion	目前仅供免费体验。 > 免费额度用完后不可调用

5.15 虚拟模特

模型名称	输出单价
wanx-virtualmodel	目前仅供免费体验。 > 免费额度用完后不可调用
virtualmodel-v2

5.16 鞋靴模特

模型名称	输出单价
shoemodel-v1	目前仅供免费体验。 > 免费额度用完后不可调用。

5.17 创意海报生成

模型名称	输出单价
wanx-poster-generation-v1	目前仅供免费体验。 > 免费额度用完后不可调用

5.18 人物写真生成-FaceChain

facechain-facedetect：限时免费。
facechain-finetune：按训练次数计费，请求失败不计费。
facechain-generation：输入不计费，输出计费。

模型服务	模型名称	单价
人物图像检测	facechain-facedetect	限时免费
人物形象训练	facechain-finetune	2.5元/次
人物写真生成	facechain-generation	0.18元/张

5.19 创意文字生成-WordArt锦书

模型服务	模型名称	输出单价
文字纹理生成	wordart-texture	0.08元/张
文字变形	wordart-semantic	0.24元/张

更多模型调用计费可通过百炼控制台查询。

五、阿里云百炼大模型服务常见问题解答

Q：我的数据安全吗？阿里云百炼会用我的数据进行训练吗？
A：阿里云严格保护数据隐私，绝不会将您的数据用于模型训练。同时，您在构建应用或训练大模型过程中传输的数据都会经过加密，以确保数据安全。

Q：阿里云百炼提供哪些地域的模型服务？不同地域有什么区别？
A：阿里云百炼提供以下地域的模型服务：
华北2（北京）、美国（弗吉尼亚）、国际（新加坡）和德国（法兰克福）地域
选择邻近地域调用可降低网络延迟。不同地域的服务接入点（Endpoint/Base URL）不同，且API Key不通用，支持的模型、平台功能及价格也有所不同。

Q：如何避免自动扣费？
A：阿里云百炼采用按量付费模式，本身不提供"自动扣费"开关。为避免产生费用，您可采取以下措施：

删除 API Key：访问阿里云百炼控制台，在页面右上角选择目标地域，进入API-KEY页面，删除所有 API Key，彻底阻断费用产生。
停止所有调用：停止应用程序、智能体、工作流中的模型调用，并排查定时任务或后台进程。
清理计费资源：删除不再使用的知识库；访问模型部署页面，下线按算力时长计费的部署实例等。
开启“免费额度用完即停”（仅限新用户且在免费额度有效期内）：在模型详情页开启此开关，免费额度耗尽时服务自动停止，避免转为付费。仅适用于中国大陆版（北京）模型，且在免费额度有效期内。
设置费用监控和预警：查看账单详情和模型监控，并设置高额消费预警，及时干预异常消费。
订阅 Coding Plan（AI编码套餐）：采用固定月费，提供月度请求额度，无按量扣费风险。请确保使用 Coding Plan 专属的 Base URL 和 API Key 进行调用，否则模型调用将按量付费。

Q：如何使用Qwen3系列模型或DeepSeek？
A：

在线体验：请访问阿里云百炼控制台，在页面右上角选择目标地域，进入模型广场页面，点击模型进行体验（DeepSeek仅支持北京地域）。
通过API调用模型
通过开发工具（如Claude Code）调用模型
通过可视化界面构建大模型应用

2026年截至目前，阿里云的AI产品优惠权益还有阿里云百炼 Token Plan，提供多档位套餐，包月预算可控；Qwen3.6 发布，全模型通享 4.5 折；旗舰模型入门首选，适配千行百业 AI 落地；AI 创新场景应用，开箱即用，适配千行百业 AI 落地；阿里云百炼按量达标返券，先用后返，最高返200元；阿里云 JVS Claw 39元起，一键接入 OpenClaw；先进弹性的 AI 算力，高性价比 AI 算力，快速部署千问大模型等其他优惠，详情可通过阿里云权益中心了解：https://www.aliyun.com/benefit

除了AI产品优惠权益之外，云服务器相关活动也是用户非常关心的，在阿里云2026年的活动中，参与活动的云服务器主要有经济型e实例2核2G3M带宽40G ESSD Entry云盘99元1年；通用算力型u1实例2核4G5M带宽80G ESSD云盘企业专享199元1年，轻量云服务器2核2G200M峰值带宽38元一年、2核4G200M峰值带宽9.9元1个月和199元一年，以及通用算力型u2a实例2.5折起，通用算力型u2i实例3折，九代c9i、g9i、r9i等实例1年付6.4折起等其他实例规格的云服务器。更多云产品配置和实时价格可通过阿里云的活动中心：https://t.aliyun.com/U/3vGTeD 查询当前参与活动的云服务器和其他云产品配置的价格信息以及优惠券等信息，如下图所示：

购买之前建议先了解一下当下是否有优惠券或者代金券可以领取，2026年，阿里云官方已经通过云小站平台：https://www.aliyun.com/minisite/goods 推出云产品通用7.5折优惠券，先领券再购买，价格可以在优惠价格基础上额外获得一个7.5折优惠，最高能减12500元。

小结：阿里云百炼大模型服务平台凭借其丰富的模型生态、全链路开发能力、企业级安全保障以及灵活的计费模式，为企业和开发者提供了高效、便捷、安全的大模型开发与部署解决方案。新用户可享受超7000万免费tokens的优惠活动，进一步降低了AI应用的入门门槛。无论是从模型选择、开发效率、成本控制还是数据安全等方面考虑，阿里云百炼都是企业和开发者实现AI创新与落地的理想选择。

一、阿里云百炼大模型服务平台介绍

二、阿里云百炼大模型服务平台的优势

1. 丰富的模型生态与灵活性

2. 全链路开发与快速落地

3. 企业级安全与合规保障

4. 成本优化与灵活计费

5. 高效的生态与技术支持

6. 高扩展性与场景适配性

三、阿里云百炼大模型服务新人免费额度介绍

1、活动内容

2、活动规则

四、模型调用收费标准

1、阶梯计费规则

2、文本生成-千问

2.1 千问Max

2.2 千问Plus

2.3 千问Flash

2.4 千问Turbo

2.5 QwQ

2.6 千问Long

2.7 千问Omni

2.8 千问Omni-Realtime

2.9 QVQ

2.10 千问VL

2.11 千问OCR

2.12 千问Audio

2.13 千问数学模型

2.14 千问Coder

2.15 千问翻译模型

2.16 千问数据挖掘模型

2.17 千问深入研究模型

2.18 通义晓蜜对话分析模型

3、文本生成-千问-开源版

3.1 Qwen3.6

3.2 Qwen3.5

3.3 Qwen3

3.4 QwQ-开源版

3.5 QwQ-Preview

3.6 Qwen2.5

3.7 QVQ

3.8 Qwen-Omni

3.9 Qwen3-Omni-Captioner

3.10 Qwen-VL

3.12 Qwen-Math

3.13 Qwen-Coder

4、文本生成-第三方模型

4.1 DeepSeek

4.2 DeepSeek-硅基流动

4.3 DeepSeek-快手万擎

4.4 Kimi

4.5 Kimi-月之暗面

4.6 GLM

4.7 MiniMax

4.8 MiniMax-稀宇科技

5、图像生成

5.1 千问文生图

5.2 千问图像编辑

5.3 千问图像翻译

5.4 Z-Image

5.5 万相文生图

5.6 万相图像生成与编辑

5.7 万相通用图像编辑

5.8 万相涂鸦作画

5.9 万相图像局部重绘

5.10 人像风格重绘

5.11 图像背景生成

5.12 图像画面扩展

5.13 人物实例分割

5.14 图像擦除补全

5.15 虚拟模特

5.16 鞋靴模特

5.17 创意海报生成

5.18 人物写真生成-FaceChain

5.19 创意文字生成-WordArt锦书

五、阿里云百炼大模型服务常见问题解答

相关文章