阿里云AI通用型节省计划模型：三类折扣低至5.3折，新客领券再省50%

2026年6月8日14:07

大模型调用成本高？阿里云AI通用型节省计划帮你降本增效。该方案专为按量付费场景设计，承诺3至24个月月消费额即可享阶梯折扣，灵活性不变。A类模型（千问全系列、开源模型及工具调用）最高6.8折，B类多模态服务（图像生成、语音合成、视频生成）最高5.3折，C类三方直供模型（qwen3.6-max-preview、DeepSeek、Kimi）暂不参与抵扣。支持全预付与零预付两种方式，承诺越多、周期越长，折扣力度越大。新用户更可叠加全模型通用抵扣券（最高500元）及AI加速季满减券，叠加使用性价比更优。

一、AI通用型节省计划A类模型参考

AI通用型节省计划中定义的A类模型具体涵盖以下几大类别及对应模型清单。这些模型均属于“阿里直供”范畴，可被 AI 通用型节省计划按折扣抵扣其调用费用（包括输入/输出 Tokens、工具调用等）。更多阿里云大模型服务平台百炼节省计划与资源包官方介绍可参考：https://help.aliyun.com/zh/model-studio/savings-plan-and-resource-package

1.1 千问（不含 `qwen3.6-max-preview`）

指阿里云自研的通义千问商业版大语言模型系列，但排除 qwen3.6-max-preview 这一预览版本。具体包括：

千问 Max 系列
- qwen3.7-max、qwen3-max、qwen-max、qwen-max-latest 及历史稳定版本（如 qwen-max-0403、qwen-max-0107、qwen-max-1201）
千问 Plus 系列
- qwen3.7-plus、qwen3.6-plus、qwen3.5-plus、qwen-plus、qwen-plus-latest
千问 Turbo / Flash 系列
- qwen3.6-flash、qwen3.5-flash、qwen-flash、qwen-turbo
千问 Long 系列（长文本处理）
- qwen-long、qwen-long-latest

重要排除项：qwen3.6-max-preview 不在 A 类支持范围内，属于 C 类（无折扣）。

1.2 千问-开源

指阿里云在魔搭（ModelScope）等平台开源并上架至百炼平台的通义千问系列模型，包括：

Qwen3 系列：Qwen3、Qwen3.5
Qwen2.5 系列：Qwen2.5
QwQ 系列：QwQ、QwQ-Preview
领域专用开源模型：
- Qwen-Math（数学推理）
- Qwen-Coder（代码生成）
经典开源对话模型：
- qwen-72b-chat、qwen-14b-chat、qwen-7b-chat
- qwen1.5-72b-chat、qwen1.5-14b-chat、qwen1.5-7b-chat

所有上述开源模型若通过百炼平台调用，均计入 A 类抵扣范围。

1.3 文本向量模型

用于生成文本稠密向量表示的模型，支持语义检索、RAG 等场景，包括：

text-embedding-v1、v2、v3、v4
text-embedding-async-v1、v2
OpenSearch 集成的文本向量模型（如 ops-text-embedding-001、ops-text-embedding-zh-001、ops-text-embedding-en-001）

1.4 多模态向量模型

支持图像、文本或多模态组合输入，生成统一向量表示，包括：

qwen2.5-vl-embedding
tongyi-embedding-vision-plus
tongyi-embedding-vision-flash
multimodal-embedding-v1
OpenSearch 多模态向量服务：ops-gme-qwen2-vl-2b-instruct

1.5 排序模型（Rerank）

用于对检索结果进行相关性重排序，提升搜索精度，包括：

qwen3-rerank
gte-rerank-v2

1.6 行业模型（垂类模型）

指针对特定行业或任务优化的阿里直供模型，例如：

千问 Coder（代码生成与理解）
千问翻译模型
千问数据挖掘模型
千问深入研究模型

此类模型通常在百炼控制台中标注为“垂类模型”或“行业模型”，且由阿里云直接提供。

1.7 模型原生工具调用（Function Calling 相关）

A 类覆盖以下由模型原生支持的工具调用功能所产生的费用：

Function Calling：模型调用外部函数/API 的计次费用
联网搜索：模型在推理过程中主动发起的互联网搜索（需启用 enableSearch）
网页抓取：基于搜索结果进一步提取网页内容的行为

明确排除：MCP 广场中的联网搜索、百炼“模型体验”页面中的联网搜索不支持抵扣。

A 类模型的核心特征

特征	说明
归属	必须为阿里直供模型（非三方直供）
类型覆盖	大语言模型（LLM）、向量模型（Embedding）、排序模型（Rerank）、行业垂类模型
功能覆盖	文本生成、向量化、重排序、Function Calling、联网搜索（限定场景）
排除项	`qwen3.6-max-preview`、所有三方直供模型（如 Kimi、GLM、MiniMax 等）

用户可通过百炼控制台模型卡片右上角的“阿里直供”标签确认是否属于 A 类支持范围。如下图所示：

二、AI通用型节省计划B 类模型参考

B 类模型与服务是指在 AI 通用型节省计划中可被抵扣的、除文本生成类大语言模型（A 类）以外的多模态生成与感知类能力，具体涵盖以下四大方向及其对应的模型清单：

2.1 图像生成

指通过文本或图像输入生成新图像的能力，包括万相（Tongyi Wanxiang）系列模型，但不包含千问文生图模型（如 Qwen-VL 系列用于理解而非生成）。

万相文生图模型：
- wan2.7-t2v-2026-04-25（注：虽名为 t2v，但在图像生成上下文中为图文生成）
- 实际图像生成模型命名通常以 wanx 或 wan 开头，例如：
  - wanx-1.0-text-to-image
  - wanx-2.0-style-transfer
  - wanx-sketch-to-image
支持功能：
- 文本生成图像（Text-to-Image）
- 图像风格迁移
- 手绘草图生成精细图像

注意：千问 Omni、Qwen-VL 等多模态模型主要用于视觉理解（VQA、OCR 等），不属于图像生成范畴，不计入 B 类图像生成抵扣项。

2.2 语音合成

将文本转换为自然语音音频的服务，支持实时与非实时场景，包括以下模型系列：

1、CosyVoice 系列（推荐用于高自然度合成）

cosyvoice-v3-plus
cosyvoice-v3-flash
cosyvoice-v2
cosyvoice-v1

2、Qwen-TTS 系列

实时语音合成：
- qwen3-tts-flash-realtime
- qwen3-tts-flash-realtime-2025-09-18
- qwen-tts-realtime
- qwen-tts-realtime-latest
- qwen-tts-realtime-2025-07-15
非实时语音合成（批量场景）：
- qwen3-tts-flash
- qwen3-tts-flash-2025-09-18
- qwen-tts
- qwen-tts-latest
- qwen-tts-2025-05-22
- qwen-tts-2025-04-10

所有上述模型均属于阿里直供，可被 B 类节省计划抵扣。

2.3 语音识别与翻译

将语音转为文本，并支持多语种识别与翻译，包括：

1、Paraformer 系列（阿里自研 ASR 引擎）

实时识别：
- paraformer-realtime-v2
- paraformer-realtime-v1
- paraformer-realtime-8k-v2
- paraformer-realtime-8k-v1
录音文件识别：
- paraformer-v2
- paraformer-v1
- paraformer-8k-v2
- paraformer-8k-v1
- paraformer-mtl-v1（多任务学习版本）

2、Fun-ASR 系列

实时识别：
- fun-asr-realtime
- fun-asr-realtime-2025-11-07
- fun-asr-realtime-2025-09-15
录音文件识别：
- fun-asr
- fun-asr-2025-11-07
- fun-asr-2025-08-25
- fun-asr-mtl
- fun-asr-mtl-2025-08-25

3、Qwen-ASR 系列

实时识别：
- qwen3-asr-flash-realtime
- qwen3-asr-flash-realtime-2025-10-27
录音文件识别：
- qwen3-asr-flash-filetrans
- qwen3-asr-flash-filetrans-2025-11-17
- qwen3-asr-flash
- qwen3-asr-flash-2025-09-08

支持语种包括中文（含粤语、四川话等方言）、英语、日语、韩语、法语、德语、俄语、葡萄牙语、越南语等。

2.4 视频生成与编辑

基于文本或图像生成视频，或对已有视频进行智能编辑，主要包括：

1、文生视频

happyhorse-1.0-t2v
wan2.7-t2v-2026-04-25

2、图生视频

happyhorse-1.0-i2v
wan2.7-i2v-2026-04-25

3、视频编辑

happyhorse-1.0-video-edit
wan2.7-videoedit

上述模型由阿里通义实验室研发，属于“HappyHorse”和“Wan”系列，均为阿里直供模型，可被 B 类节省计划抵扣。

重要排除项：若模型标注为“三方直供”（如某些第三方视频生成模型），则属于 C 类，不支持抵扣。

B 类模型的核心特征

类别	功能	典型模型前缀/名称	是否支持抵扣
图像生成	文生图、风格迁移	`wanx-`、`wan-`	是（阿里直供）
语音合成	TTS（实时/批量）	`cosyvoice-`、`qwen-tts-`	是
语音识别	ASR（实时/文件）	`paraformer-`、`fun-asr-`、`qwen-asr-`	是
视频生成与编辑	T2V、I2V、视频编辑	`happyhorse-`、`wan2.7-`	是

三、AI通用型节省计划C 类模型参考

C 类模型是指在 AI 通用型节省计划中明确不支持费用抵扣的模型类别，其定义包含两类：一是特定阿里自研模型（如 qwen3.6-max-preview），二是所有三方直供模型（即由第三方厂商部署并上架至百炼平台的模型）。以下是 C 类所涵盖的具体模型清单及分类说明：

3.1 阿里自研但排除在抵扣范围外的模型

qwen3.6-max-preview
- Qwen3.6 系列中规模最大的闭源预览版模型，仅支持纯文本输入，具备思考模式与 Function Calling 能力，但明确被排除在 A/B 类之外，属于 C 类。

注意：其他 qwen3.x-max 正式版（如 qwen3.7-max、qwen3-max）属于 A 类，可抵扣；唯独 qwen3.6-max-preview 因为是“preview”版本而被单独归入 C 类。

3.2 所有三方直供模型

指由非阿里云主体（如月之暗面、智谱 AI、稀宇科技、阶跃星辰、小米等）自行部署并上架至百炼平台的模型实例，无论其基础架构是否源自开源或商业授权，只要部署方非阿里云，即视为“三方直供”，全部归入 C 类，不支持任何节省计划抵扣。

具体包括以下品牌及对应模型：

1. DeepSeek

阿里云直供版本（如 deepseek-v3.2、deepseek-r1）属于 A 类，可抵扣；
但若为 DeepSeek 自行部署的模型（如通过 MCP 广场或外部接入），则属于 C 类，不可抵扣。

2. Kimi（月之暗面）

阿里云百炼部署版本（如 kimi-k2.6、kimi-k2.5）属于 A 类，可抵扣；
月之暗面自行部署版本（如 kimi/kimi-k2.6、kimi/kimi-k2.5、Moonshot-Kimi-K2-Instruct）属于 C 类，不可抵扣。

3. GLM（智谱 AI）

阿里云百炼部署版本（如 glm-5.1、glm-5）属于 A 类；
智谱 AI 自行部署版本（如 ZHIPU/GLM-5.1、ZHIPU/GLM-5）属于 C 类。

4. MiniMax（稀宇科技）

阿里云百炼部署版本（如 MiniMax-M2.5、MiniMax-M2.1）属于 A 类；
稀宇科技自行部署版本（如 MiniMax/MiniMax-M3、MiniMax/MiniMax-M2.7 等）属于 C 类。

5. HappyHorse

“HappyHorse 三方直供模型”属于 C 类；
尽管部分视频/图像生成模型（如 happyhorse-1.0-t2v）在 B 类描述中被提及，但仅限阿里直供版本；
若为第三方通过 HappyHorse 品牌上架的模型（非阿里部署），则归入 C 类，不支持抵扣。

6. 其他三方模型示例

MiMo（小米）：xiaomi/mimo-v2.5-pro → C 类
Stepfun（阶跃星辰）：stepfun/step-3.7-flash → C 类

关键判定原则
用户可通过以下方式判断某模型是否属于 C 类：

判定维度	属于 C 类（不可抵扣）	不属于 C 类（可抵扣）
部署主体	模型由第三方（非阿里云）部署	由阿里云部署（标注“阿里直供”）
控制台标识	无“阿里直供”标签	有“阿里直供”标签
模型类型	`qwen3.6-max-preview`（唯一例外的阿里模型）	其他千问系列正式版

重要提醒：即使模型名称与阿里直供版本相同，只要部署路径或来源不同，即视为 C 类，无法享受 AI 通用型节省计划的任何折扣抵扣。建议用户在调用前确认模型卡片上的“阿里直供”标识。

四、AI 通用型节省计划扣费说明与不同类型折扣信息参考

4.1 扣费说明

生效时间：可按需选择“开通后立即生效”或“指定时间（按小时）生效”。

承诺周期说明：以月为单位（从生效日到下个月的对应日），月承诺周期结束时，剩余额度自动过期，不可累积到下一周期。举例：如果一次性订阅了 3 个月的节省计划（月承诺额度 1000 元），并非在 3 个月内获得 3000 元总额度，而是每月独立获得 1000 元额度，当月未使用完的部分自动清零，不可累积到下个订阅月。

抵扣范围：

支持抵扣：模型调用（输入和输出 Tokens）、模型原生工具调用（如 Function Call、联网搜索、网页抓取等）、上下文缓存、批量推理等产生的费用。
不支持抵扣：模型调优、模型部署的费用，以及 MCP 广场和模型体验的联网搜索的费用。

抵扣逻辑：

抵扣顺序：免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。
多个同类型的节省计划：优先抵扣先到期的节省计划。若到期时间相同，则优先抵扣先购买的节省计划。
超出部分处理：如果同类节省计划全部到期或额度全部抵扣完后，仍有超出部分，自动转为按量付费。

每月承诺消费金额范围：
用于抵扣模型服务按量计费的每月承诺消费额。可自定义金额，1000 元起，以 10 元为单位调整，不设上限。

承诺周期：
可选择以下四个档位的承诺周期：3个月、6个月、12个月、24个月。

付费方式

全预付：一次性支付整个承诺周期内的全部承诺消费金额，可享最大折扣。
零预付：购买时无需支付，之后按月支付承诺消费金额。零预付需联系商务经理开通白名单后使用。

4.2 折扣信息

不同模型、不同档位、承诺周期和付款方式享受不同的折扣。

例如：选择了为期 12 个月、每月承诺消费 10,000 元的节省计划，采用全预付的方式支付，此时调用千问文本生成模型（A 类）时，享受 8 折优惠，即一次原价 1 元的模型调用，实际从节省计划额度中抵扣 0.8 元。

以下表格中的金额范围含起始值、不含结束值。例如 1,000 - 5,000 表示金额大于等于 1,000 且小于 5,000。

付款方式	月承诺金额（元）	A类3个月	A类6个月	A类12个月	A类24个月	B类3个月	B类6个月	B类12个月	B类24个月	C类全周期
全预付	[1,000, 5,000)	8.8折	8.6折	8.4折	8.2折	8.3折	8折	7.7折	7.4折	无折扣
全预付	[5,000, 10,000)	8.6折	8.4折	8.2折	8折	8折	7.7折	7.4折	7.1折	无折扣
全预付	[10,000, 30,000)	8.4折	8.2折	8折	7.8折	7.7折	7.4折	7.1折	6.8折	无折扣
全预付	[30,000, 50,000)	8.2折	8折	7.8折	7.6折	7.4折	7.1折	6.8折	6.5折	无折扣
全预付	[50,000, 100,000)	8折	7.8折	7.6折	7.4折	7.1折	6.8折	6.5折	6.2折	无折扣
全预付	[100,000, 300,000)	7.8折	7.6折	7.4折	7.2折	6.8折	6.5折	6.2折	5.9折	无折扣
全预付	[300,000, 1,000,000)	7.6折	7.4折	7.2折	7折	6.5折	6.2折	5.9折	5.6折	无折扣
全预付	[1,000,000, ~)	7.4折	7.2折	7折	6.8折	6.2折	5.9折	5.6折	5.3折	无折扣
零预付	[1,000, 5,000)	9折	8.8折	8.6折	8.4折	8.5折	8.2折	7.9折	7.6折	无折扣
零预付	[5,000, 10,000)	8.8折	8.6折	8.4折	8.2折	8.2折	7.9折	7.6折	7.3折	无折扣
零预付	[10,000, 30,000)	8.6折	8.4折	8.2折	8折	7.9折	7.6折	7.3折	7折	无折扣
零预付	[30,000, 50,000)	8.4折	8.2折	8折	7.8折	7.6折	7.3折	7折	6.7折	无折扣
零预付	[50,000, 100,000)	8.2折	8折	7.8折	7.6折	7.3折	7折	6.7折	6.4折	无折扣
零预付	[100,000, 300,000)	8折	7.8折	7.6折	7.4折	7折	6.7折	6.4折	6.1折	无折扣
零预付	[300,000, 1,000,000)	7.8折	7.6折	7.4折	7.2折	6.7折	6.4折	6.1折	5.8折	无折扣
零预付	1,000,000 及以上	7.6折	7.4折	7.2折	7折	6.4折	6.1折	5.8折	5.5折	无折扣

此外，阿里云还推出了入门型AI通用节省计划，面向新用户提供三档全模型通用抵扣券：全模型通用抵扣20元（新客当月抵扣，直省50%，价格10元/1个月）、全模型通用抵扣100元（新客当月抵扣，直省50%，价格50元/1个月）、全模型通用抵扣500元（新客当月抵扣，直省50%，价格250元/1个月）。详情可通过智启AI普惠权益：https://www.aliyun.com/benefit/ai/discount 等相关活动查阅。

另外，想要便宜购买阿里云AI通用型节省计划，用户可先领取阿里云赠送的优惠券，目前正值阿里云AI加速季活动期间，个人和企业用户可先领取满减优惠券：个人360元，最高可减150元，企业用户1728元，最高可减800元。领券之后可根据订单金额获得一定金额的满减优惠，详情可参考：https://www.aliyun.com/activity/hub/ai-innovation

购买百炼AI通用节省计划也可以使用优惠券抵扣，如下图所示：

小结：阿里云AI通用型节省计划通过A、B、C三类模型的划分，帮助用户精准掌握哪些模型可享折扣、哪些不支持抵扣。A类覆盖阿里直供的千问全系列、开源模型及向量/排序/工具调用能力；B类包含图像生成、语音合成、语音识别及视频生成等多模态服务；C类则明确排除了qwen3.6-max-preview及所有三方直供模型。结合全预付与零预付两种付费方式，A类最高可享6.8折、B类最高可达5.3折，承诺金额越高、周期越长，折扣力度越大。用户在实际调用前，务必通过百炼控制台确认模型的"阿里直供"标识，避免因误选而产生额外成本，从而真正实现大模型推理场景的精细化降本。