大模型调用成本高?阿里云AI通用型节省计划帮你降本增效。该方案专为按量付费场景设计,承诺3至24个月月消费额即可享阶梯折扣,灵活性不变。A类模型(千问全系列、开源模型及工具调用)最高6.8折,B类多模态服务(图像生成、语音合成、视频生成)最高5.3折,C类三方直供模型(qwen3.6-max-preview、DeepSeek、Kimi)暂不参与抵扣。支持全预付与零预付两种方式,承诺越多、周期越长,折扣力度越大。新用户更可叠加全模型通用抵扣券(最高500元)及AI加速季满减券,叠加使用性价比更优。

一、AI通用型节省计划A类模型参考
AI通用型节省计划中定义的A类模型具体涵盖以下几大类别及对应模型清单。这些模型均属于“阿里直供”范畴,可被 AI 通用型节省计划按折扣抵扣其调用费用(包括输入/输出 Tokens、工具调用等)。更多阿里云大模型服务平台百炼节省计划与资源包官方介绍可参考:https://help.aliyun.com/zh/model-studio/savings-plan-and-resource-package

1.1 千问(不含 qwen3.6-max-preview)
指阿里云自研的通义千问商业版大语言模型系列,但排除 qwen3.6-max-preview 这一预览版本。具体包括:
- 千问 Max 系列
qwen3.7-max、qwen3-max、qwen-max、qwen-max-latest及历史稳定版本(如qwen-max-0403、qwen-max-0107、qwen-max-1201)
- 千问 Plus 系列
qwen3.7-plus、qwen3.6-plus、qwen3.5-plus、qwen-plus、qwen-plus-latest
- 千问 Turbo / Flash 系列
qwen3.6-flash、qwen3.5-flash、qwen-flash、qwen-turbo
- 千问 Long 系列(长文本处理)
qwen-long、qwen-long-latest
重要排除项:qwen3.6-max-preview 不在 A 类支持范围内,属于 C 类(无折扣)。
1.2 千问-开源
指阿里云在魔搭(ModelScope)等平台开源并上架至百炼平台的通义千问系列模型,包括:
- Qwen3 系列:
Qwen3、Qwen3.5 - Qwen2.5 系列:
Qwen2.5 - QwQ 系列:
QwQ、QwQ-Preview - 领域专用开源模型:
Qwen-Math(数学推理)Qwen-Coder(代码生成)
- 经典开源对话模型:
qwen-72b-chat、qwen-14b-chat、qwen-7b-chatqwen1.5-72b-chat、qwen1.5-14b-chat、qwen1.5-7b-chat
所有上述开源模型若通过百炼平台调用,均计入 A 类抵扣范围。
1.3 文本向量模型
用于生成文本稠密向量表示的模型,支持语义检索、RAG 等场景,包括:
text-embedding-v1、v2、v3、v4text-embedding-async-v1、v2- OpenSearch 集成的文本向量模型(如
ops-text-embedding-001、ops-text-embedding-zh-001、ops-text-embedding-en-001)
1.4 多模态向量模型
支持图像、文本或多模态组合输入,生成统一向量表示,包括:
qwen2.5-vl-embeddingtongyi-embedding-vision-plustongyi-embedding-vision-flashmultimodal-embedding-v1- OpenSearch 多模态向量服务:
ops-gme-qwen2-vl-2b-instruct
1.5 排序模型(Rerank)
用于对检索结果进行相关性重排序,提升搜索精度,包括:
qwen3-rerankgte-rerank-v2
1.6 行业模型(垂类模型)
指针对特定行业或任务优化的阿里直供模型,例如:
- 千问 Coder(代码生成与理解)
- 千问翻译模型
- 千问数据挖掘模型
- 千问深入研究模型
此类模型通常在百炼控制台中标注为“垂类模型”或“行业模型”,且由阿里云直接提供。
1.7 模型原生工具调用(Function Calling 相关)
A 类覆盖以下由模型原生支持的工具调用功能所产生的费用:
- Function Calling:模型调用外部函数/API 的计次费用
- 联网搜索:模型在推理过程中主动发起的互联网搜索(需启用
enableSearch) - 网页抓取:基于搜索结果进一步提取网页内容的行为
明确排除:MCP 广场中的联网搜索、百炼“模型体验”页面中的联网搜索不支持抵扣。
A 类模型的核心特征
| 特征 | 说明 |
|---|---|
| 归属 | 必须为 阿里直供模型(非三方直供) |
| 类型覆盖 | 大语言模型(LLM)、向量模型(Embedding)、排序模型(Rerank)、行业垂类模型 |
| 功能覆盖 | 文本生成、向量化、重排序、Function Calling、联网搜索(限定场景) |
| 排除项 | qwen3.6-max-preview、所有三方直供模型(如 Kimi、GLM、MiniMax 等) |
用户可通过百炼控制台模型卡片右上角的“阿里直供”标签确认是否属于 A 类支持范围。 如下图所示:

二、AI通用型节省计划B 类模型参考
B 类模型与服务是指在 AI 通用型节省计划中可被抵扣的、除文本生成类大语言模型(A 类)以外的多模态生成与感知类能力,具体涵盖以下四大方向及其对应的模型清单:
2.1 图像生成
指通过文本或图像输入生成新图像的能力,包括万相(Tongyi Wanxiang)系列模型,但不包含千问文生图模型(如 Qwen-VL 系列用于理解而非生成)。
- 万相文生图模型:
wan2.7-t2v-2026-04-25(注:虽名为 t2v,但在图像生成上下文中为图文生成)- 实际图像生成模型命名通常以
wanx或wan开头,例如:wanx-1.0-text-to-imagewanx-2.0-style-transferwanx-sketch-to-image
- 支持功能:
- 文本生成图像(Text-to-Image)
- 图像风格迁移
- 手绘草图生成精细图像
注意:千问 Omni、Qwen-VL 等多模态模型主要用于视觉理解(VQA、OCR 等),不属于图像生成范畴,不计入 B 类图像生成抵扣项。
2.2 语音合成
将文本转换为自然语音音频的服务,支持实时与非实时场景,包括以下模型系列:
1、CosyVoice 系列(推荐用于高自然度合成)
cosyvoice-v3-pluscosyvoice-v3-flashcosyvoice-v2cosyvoice-v1
2、Qwen-TTS 系列
- 实时语音合成:
qwen3-tts-flash-realtimeqwen3-tts-flash-realtime-2025-09-18qwen-tts-realtimeqwen-tts-realtime-latestqwen-tts-realtime-2025-07-15
- 非实时语音合成(批量场景):
qwen3-tts-flashqwen3-tts-flash-2025-09-18qwen-ttsqwen-tts-latestqwen-tts-2025-05-22qwen-tts-2025-04-10
所有上述模型均属于阿里直供,可被 B 类节省计划抵扣。
2.3 语音识别与翻译
将语音转为文本,并支持多语种识别与翻译,包括:
1、Paraformer 系列(阿里自研 ASR 引擎)
- 实时识别:
paraformer-realtime-v2paraformer-realtime-v1paraformer-realtime-8k-v2paraformer-realtime-8k-v1
- 录音文件识别:
paraformer-v2paraformer-v1paraformer-8k-v2paraformer-8k-v1paraformer-mtl-v1(多任务学习版本)
2、Fun-ASR 系列
- 实时识别:
fun-asr-realtimefun-asr-realtime-2025-11-07fun-asr-realtime-2025-09-15
- 录音文件识别:
fun-asrfun-asr-2025-11-07fun-asr-2025-08-25fun-asr-mtlfun-asr-mtl-2025-08-25
3、Qwen-ASR 系列
- 实时识别:
qwen3-asr-flash-realtimeqwen3-asr-flash-realtime-2025-10-27
- 录音文件识别:
qwen3-asr-flash-filetransqwen3-asr-flash-filetrans-2025-11-17qwen3-asr-flashqwen3-asr-flash-2025-09-08
支持语种包括中文(含粤语、四川话等方言)、英语、日语、韩语、法语、德语、俄语、葡萄牙语、越南语等。
2.4 视频生成与编辑
基于文本或图像生成视频,或对已有视频进行智能编辑,主要包括:
1、文生视频
happyhorse-1.0-t2vwan2.7-t2v-2026-04-25
2、图生视频
happyhorse-1.0-i2vwan2.7-i2v-2026-04-25
3、视频编辑
happyhorse-1.0-video-editwan2.7-videoedit
上述模型由阿里通义实验室研发,属于“HappyHorse”和“Wan”系列,均为阿里直供模型,可被 B 类节省计划抵扣。
重要排除项:若模型标注为“三方直供”(如某些第三方视频生成模型),则属于 C 类,不支持抵扣。
B 类模型的核心特征
| 类别 | 功能 | 典型模型前缀/名称 | 是否支持抵扣 |
|---|---|---|---|
| 图像生成 | 文生图、风格迁移 | wanx-、wan- | 是(阿里直供) |
| 语音合成 | TTS(实时/批量) | cosyvoice-、qwen-tts- | 是 |
| 语音识别 | ASR(实时/文件) | paraformer-、fun-asr-、qwen-asr- | 是 |
| 视频生成与编辑 | T2V、I2V、视频编辑 | happyhorse-、wan2.7- | 是 |
三、AI通用型节省计划C 类模型参考
C 类模型是指在 AI 通用型节省计划中明确不支持费用抵扣的模型类别,其定义包含两类:一是特定阿里自研模型(如 qwen3.6-max-preview),二是所有三方直供模型(即由第三方厂商部署并上架至百炼平台的模型)。以下是 C 类所涵盖的具体模型清单及分类说明:
3.1 阿里自研但排除在抵扣范围外的模型
qwen3.6-max-preview- Qwen3.6 系列中规模最大的闭源预览版模型,仅支持纯文本输入,具备思考模式与 Function Calling 能力,但明确被排除在 A/B 类之外,属于 C 类。
注意:其他 qwen3.x-max 正式版(如 qwen3.7-max、qwen3-max)属于 A 类,可抵扣;唯独 qwen3.6-max-preview 因为是“preview”版本而被单独归入 C 类。
3.2 所有三方直供模型
指由非阿里云主体(如月之暗面、智谱 AI、稀宇科技、阶跃星辰、小米等)自行部署并上架至百炼平台的模型实例,无论其基础架构是否源自开源或商业授权,只要部署方非阿里云,即视为“三方直供”,全部归入 C 类,不支持任何节省计划抵扣。
具体包括以下品牌及对应模型:
1. DeepSeek
- 阿里云直供版本(如
deepseek-v3.2、deepseek-r1)属于 A 类,可抵扣; - 但若为 DeepSeek 自行部署的模型(如通过 MCP 广场或外部接入),则属于 C 类,不可抵扣。
2. Kimi(月之暗面)
- 阿里云百炼部署版本(如
kimi-k2.6、kimi-k2.5)属于 A 类,可抵扣; - 月之暗面自行部署版本(如
kimi/kimi-k2.6、kimi/kimi-k2.5、Moonshot-Kimi-K2-Instruct)属于 C 类,不可抵扣。
3. GLM(智谱 AI)
- 阿里云百炼部署版本(如
glm-5.1、glm-5)属于 A 类; - 智谱 AI 自行部署版本(如
ZHIPU/GLM-5.1、ZHIPU/GLM-5)属于 C 类。
4. MiniMax(稀宇科技)
- 阿里云百炼部署版本(如
MiniMax-M2.5、MiniMax-M2.1)属于 A 类; - 稀宇科技自行部署版本(如
MiniMax/MiniMax-M3、MiniMax/MiniMax-M2.7等)属于 C 类。
5. HappyHorse
- “HappyHorse 三方直供模型”属于 C 类;
- 尽管部分视频/图像生成模型(如
happyhorse-1.0-t2v)在 B 类描述中被提及,但仅限阿里直供版本; - 若为第三方通过 HappyHorse 品牌上架的模型(非阿里部署),则归入 C 类,不支持抵扣。
6. 其他三方模型示例
- MiMo(小米):
xiaomi/mimo-v2.5-pro→ C 类 - Stepfun(阶跃星辰):
stepfun/step-3.7-flash→ C 类
关键判定原则
用户可通过以下方式判断某模型是否属于 C 类:
| 判定维度 | 属于 C 类(不可抵扣) | 不属于 C 类(可抵扣) |
|---|---|---|
| 部署主体 | 模型由第三方(非阿里云)部署 | 由阿里云部署(标注“阿里直供”) |
| 控制台标识 | 无“阿里直供”标签 | 有“阿里直供”标签 |
| 模型类型 | qwen3.6-max-preview(唯一例外的阿里模型) | 其他千问系列正式版 |
重要提醒:即使模型名称与阿里直供版本相同,只要部署路径或来源不同,即视为 C 类,无法享受 AI 通用型节省计划的任何折扣抵扣。建议用户在调用前确认模型卡片上的“阿里直供”标识。
四、AI 通用型节省计划扣费说明与不同类型折扣信息参考
4.1 扣费说明
生效时间:可按需选择“开通后立即生效”或“指定时间(按小时)生效”。
承诺周期说明:以月为单位(从生效日到下个月的对应日),月承诺周期结束时,剩余额度自动过期,不可累积到下一周期。举例:如果一次性订阅了 3 个月的节省计划(月承诺额度 1000 元),并非在 3 个月内获得 3000 元总额度,而是每月独立获得 1000 元额度,当月未使用完的部分自动清零,不可累积到下个订阅月。
抵扣范围:
- 支持抵扣:模型调用(输入和输出 Tokens)、模型原生工具调用(如 Function Call、联网搜索、网页抓取等)、上下文缓存、批量推理等产生的费用。
- 不支持抵扣:模型调优、模型部署的费用,以及 MCP 广场和模型体验的联网搜索的费用。
抵扣逻辑:
- 抵扣顺序:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。
- 多个同类型的节省计划:优先抵扣先到期的节省计划。若到期时间相同,则优先抵扣先购买的节省计划。
- 超出部分处理:如果同类节省计划全部到期或额度全部抵扣完后,仍有超出部分,自动转为按量付费。
每月承诺消费金额范围:
用于抵扣模型服务按量计费的每月承诺消费额。可自定义金额,1000 元起,以 10 元为单位调整,不设上限。
承诺周期:
可选择以下四个档位的承诺周期:3个月、6个月、12个月、24个月。
付费方式
- 全预付:一次性支付整个承诺周期内的全部承诺消费金额,可享最大折扣。
- 零预付:购买时无需支付,之后按月支付承诺消费金额。零预付需联系商务经理开通白名单后使用。
4.2 折扣信息
不同模型、不同档位、承诺周期和付款方式享受不同的折扣。
例如:选择了为期 12 个月、每月承诺消费 10,000 元的节省计划,采用全预付的方式支付,此时调用千问文本生成模型(A 类)时,享受 8 折优惠,即一次原价 1 元的模型调用,实际从节省计划额度中抵扣 0.8 元。
以下表格中的金额范围含起始值、不含结束值。例如 1,000 - 5,000 表示金额大于等于 1,000 且小于 5,000。
| 付款方式 | 月承诺金额(元) | A类3个月 | A类6个月 | A类12个月 | A类24个月 | B类3个月 | B类6个月 | B类12个月 | B类24个月 | C类全周期 |
|---|---|---|---|---|---|---|---|---|---|---|
| 全预付 | [1,000, 5,000) | 8.8折 | 8.6折 | 8.4折 | 8.2折 | 8.3折 | 8折 | 7.7折 | 7.4折 | 无折扣 |
| 全预付 | [5,000, 10,000) | 8.6折 | 8.4折 | 8.2折 | 8折 | 8折 | 7.7折 | 7.4折 | 7.1折 | 无折扣 |
| 全预付 | [10,000, 30,000) | 8.4折 | 8.2折 | 8折 | 7.8折 | 7.7折 | 7.4折 | 7.1折 | 6.8折 | 无折扣 |
| 全预付 | [30,000, 50,000) | 8.2折 | 8折 | 7.8折 | 7.6折 | 7.4折 | 7.1折 | 6.8折 | 6.5折 | 无折扣 |
| 全预付 | [50,000, 100,000) | 8折 | 7.8折 | 7.6折 | 7.4折 | 7.1折 | 6.8折 | 6.5折 | 6.2折 | 无折扣 |
| 全预付 | [100,000, 300,000) | 7.8折 | 7.6折 | 7.4折 | 7.2折 | 6.8折 | 6.5折 | 6.2折 | 5.9折 | 无折扣 |
| 全预付 | [300,000, 1,000,000) | 7.6折 | 7.4折 | 7.2折 | 7折 | 6.5折 | 6.2折 | 5.9折 | 5.6折 | 无折扣 |
| 全预付 | [1,000,000, ~) | 7.4折 | 7.2折 | 7折 | 6.8折 | 6.2折 | 5.9折 | 5.6折 | 5.3折 | 无折扣 |
| 零预付 | [1,000, 5,000) | 9折 | 8.8折 | 8.6折 | 8.4折 | 8.5折 | 8.2折 | 7.9折 | 7.6折 | 无折扣 |
| 零预付 | [5,000, 10,000) | 8.8折 | 8.6折 | 8.4折 | 8.2折 | 8.2折 | 7.9折 | 7.6折 | 7.3折 | 无折扣 |
| 零预付 | [10,000, 30,000) | 8.6折 | 8.4折 | 8.2折 | 8折 | 7.9折 | 7.6折 | 7.3折 | 7折 | 无折扣 |
| 零预付 | [30,000, 50,000) | 8.4折 | 8.2折 | 8折 | 7.8折 | 7.6折 | 7.3折 | 7折 | 6.7折 | 无折扣 |
| 零预付 | [50,000, 100,000) | 8.2折 | 8折 | 7.8折 | 7.6折 | 7.3折 | 7折 | 6.7折 | 6.4折 | 无折扣 |
| 零预付 | [100,000, 300,000) | 8折 | 7.8折 | 7.6折 | 7.4折 | 7折 | 6.7折 | 6.4折 | 6.1折 | 无折扣 |
| 零预付 | [300,000, 1,000,000) | 7.8折 | 7.6折 | 7.4折 | 7.2折 | 6.7折 | 6.4折 | 6.1折 | 5.8折 | 无折扣 |
| 零预付 | 1,000,000 及以上 | 7.6折 | 7.4折 | 7.2折 | 7折 | 6.4折 | 6.1折 | 5.8折 | 5.5折 | 无折扣 |
此外,阿里云还推出了入门型AI通用节省计划,面向新用户提供三档全模型通用抵扣券:全模型通用抵扣20元(新客当月抵扣,直省50%,价格10元/1个月)、全模型通用抵扣100元(新客当月抵扣,直省50%,价格50元/1个月)、全模型通用抵扣500元(新客当月抵扣,直省50%,价格250元/1个月)。详情可通过智启AI普惠权益:https://www.aliyun.com/benefit/ai/discount 等相关活动查阅。

另外,想要便宜购买阿里云AI通用型节省计划,用户可先领取阿里云赠送的优惠券,目前正值阿里云AI加速季活动期间,个人和企业用户可先领取满减优惠券:个人360元,最高可减150元,企业用户1728元,最高可减800元。领券之后可根据订单金额获得一定金额的满减优惠,详情可参考:https://www.aliyun.com/activity/hub/ai-innovation

购买百炼AI通用节省计划也可以使用优惠券抵扣,如下图所示:

小结:阿里云AI通用型节省计划通过A、B、C三类模型的划分,帮助用户精准掌握哪些模型可享折扣、哪些不支持抵扣。A类覆盖阿里直供的千问全系列、开源模型及向量/排序/工具调用能力;B类包含图像生成、语音合成、语音识别及视频生成等多模态服务;C类则明确排除了qwen3.6-max-preview及所有三方直供模型。结合全预付与零预付两种付费方式,A类最高可享6.8折、B类最高可达5.3折,承诺金额越高、周期越长,折扣力度越大。用户在实际调用前,务必通过百炼控制台确认模型的"阿里直供"标识,避免因误选而产生额外成本,从而真正实现大模型推理场景的精细化降本。