阿里云AI通用型节省计划模型:三类折扣低至5.3折,新客领券再省50%

大模型调用成本高?阿里云AI通用型节省计划帮你降本增效。该方案专为按量付费场景设计,承诺3至24个月月消费额即可享阶梯折扣,灵活性不变。A类模型(千问全系列、开源模型及工具调用)最高6.8折,B类多模态服务(图像生成、语音合成、视频生成)最高5.3折,C类三方直供模型(qwen3.6-max-preview、DeepSeek、Kimi)暂不参与抵扣。支持全预付与零预付两种方式,承诺越多、周期越长,折扣力度越大。新用户更可叠加全模型通用抵扣券(最高500元)及AI加速季满减券,叠加使用性价比更优。

一、AI通用型节省计划A类模型参考

AI通用型节省计划中定义的A类模型具体涵盖以下几大类别及对应模型清单。这些模型均属于“阿里直供”范畴,可被 AI 通用型节省计划按折扣抵扣其调用费用(包括输入/输出 Tokens、工具调用等)。更多阿里云大模型服务平台百炼节省计划与资源包官方介绍可参考:https://help.aliyun.com/zh/model-studio/savings-plan-and-resource-package

1.1 千问(不含 qwen3.6-max-preview

指阿里云自研的通义千问商业版大语言模型系列,但排除 qwen3.6-max-preview 这一预览版本。具体包括:

  • 千问 Max 系列
    • qwen3.7-maxqwen3-maxqwen-maxqwen-max-latest 及历史稳定版本(如 qwen-max-0403qwen-max-0107qwen-max-1201
  • 千问 Plus 系列
    • qwen3.7-plusqwen3.6-plusqwen3.5-plusqwen-plusqwen-plus-latest
  • 千问 Turbo / Flash 系列
    • qwen3.6-flashqwen3.5-flashqwen-flashqwen-turbo
  • 千问 Long 系列(长文本处理)
    • qwen-longqwen-long-latest

重要排除项:qwen3.6-max-preview 不在 A 类支持范围内,属于 C 类(无折扣)。

1.2 千问-开源

指阿里云在魔搭(ModelScope)等平台开源并上架至百炼平台的通义千问系列模型,包括:

  • Qwen3 系列:Qwen3Qwen3.5
  • Qwen2.5 系列:Qwen2.5
  • QwQ 系列:QwQQwQ-Preview
  • 领域专用开源模型:
    • Qwen-Math(数学推理)
    • Qwen-Coder(代码生成)
  • 经典开源对话模型:
    • qwen-72b-chatqwen-14b-chatqwen-7b-chat
    • qwen1.5-72b-chatqwen1.5-14b-chatqwen1.5-7b-chat

所有上述开源模型若通过百炼平台调用,均计入 A 类抵扣范围。

1.3 文本向量模型

用于生成文本稠密向量表示的模型,支持语义检索、RAG 等场景,包括:

  • text-embedding-v1v2v3v4
  • text-embedding-async-v1v2
  • OpenSearch 集成的文本向量模型(如 ops-text-embedding-001ops-text-embedding-zh-001ops-text-embedding-en-001

1.4 多模态向量模型

支持图像、文本或多模态组合输入,生成统一向量表示,包括:

  • qwen2.5-vl-embedding
  • tongyi-embedding-vision-plus
  • tongyi-embedding-vision-flash
  • multimodal-embedding-v1
  • OpenSearch 多模态向量服务:ops-gme-qwen2-vl-2b-instruct

1.5 排序模型(Rerank)

用于对检索结果进行相关性重排序,提升搜索精度,包括:

  • qwen3-rerank
  • gte-rerank-v2

1.6 行业模型(垂类模型)

指针对特定行业或任务优化的阿里直供模型,例如:

  • 千问 Coder(代码生成与理解)
  • 千问翻译模型
  • 千问数据挖掘模型
  • 千问深入研究模型

此类模型通常在百炼控制台中标注为“垂类模型”或“行业模型”,且由阿里云直接提供。

1.7 模型原生工具调用(Function Calling 相关)

A 类覆盖以下由模型原生支持的工具调用功能所产生的费用:

  • Function Calling:模型调用外部函数/API 的计次费用
  • 联网搜索:模型在推理过程中主动发起的互联网搜索(需启用 enableSearch
  • 网页抓取:基于搜索结果进一步提取网页内容的行为

明确排除:MCP 广场中的联网搜索、百炼“模型体验”页面中的联网搜索不支持抵扣。

A 类模型的核心特征

特征说明
归属必须为 阿里直供模型(非三方直供)
类型覆盖大语言模型(LLM)、向量模型(Embedding)、排序模型(Rerank)、行业垂类模型
功能覆盖文本生成、向量化、重排序、Function Calling、联网搜索(限定场景)
排除项qwen3.6-max-preview、所有三方直供模型(如 Kimi、GLM、MiniMax 等)

用户可通过百炼控制台模型卡片右上角的“阿里直供”标签确认是否属于 A 类支持范围。 如下图所示:

二、AI通用型节省计划B 类模型参考

B 类模型与服务是指在 AI 通用型节省计划中可被抵扣的、除文本生成类大语言模型(A 类)以外的多模态生成与感知类能力,具体涵盖以下四大方向及其对应的模型清单:

2.1 图像生成

指通过文本或图像输入生成新图像的能力,包括万相(Tongyi Wanxiang)系列模型,但不包含千问文生图模型(如 Qwen-VL 系列用于理解而非生成)。

  • 万相文生图模型:
    • wan2.7-t2v-2026-04-25(注:虽名为 t2v,但在图像生成上下文中为图文生成)
    • 实际图像生成模型命名通常以 wanx 或 wan 开头,例如:
      • wanx-1.0-text-to-image
      • wanx-2.0-style-transfer
      • wanx-sketch-to-image
  • 支持功能:
    • 文本生成图像(Text-to-Image)
    • 图像风格迁移
    • 手绘草图生成精细图像

注意:千问 Omni、Qwen-VL 等多模态模型主要用于视觉理解(VQA、OCR 等),不属于图像生成范畴,不计入 B 类图像生成抵扣项。

2.2 语音合成

将文本转换为自然语音音频的服务,支持实时与非实时场景,包括以下模型系列:

1、CosyVoice 系列(推荐用于高自然度合成)

  • cosyvoice-v3-plus
  • cosyvoice-v3-flash
  • cosyvoice-v2
  • cosyvoice-v1

2、Qwen-TTS 系列

  • 实时语音合成:
    • qwen3-tts-flash-realtime
    • qwen3-tts-flash-realtime-2025-09-18
    • qwen-tts-realtime
    • qwen-tts-realtime-latest
    • qwen-tts-realtime-2025-07-15
  • 非实时语音合成(批量场景):
    • qwen3-tts-flash
    • qwen3-tts-flash-2025-09-18
    • qwen-tts
    • qwen-tts-latest
    • qwen-tts-2025-05-22
    • qwen-tts-2025-04-10

所有上述模型均属于阿里直供,可被 B 类节省计划抵扣。

2.3 语音识别与翻译

将语音转为文本,并支持多语种识别与翻译,包括:

1、Paraformer 系列(阿里自研 ASR 引擎)

  • 实时识别:
    • paraformer-realtime-v2
    • paraformer-realtime-v1
    • paraformer-realtime-8k-v2
    • paraformer-realtime-8k-v1
  • 录音文件识别:
    • paraformer-v2
    • paraformer-v1
    • paraformer-8k-v2
    • paraformer-8k-v1
    • paraformer-mtl-v1(多任务学习版本)

2、Fun-ASR 系列

  • 实时识别:
    • fun-asr-realtime
    • fun-asr-realtime-2025-11-07
    • fun-asr-realtime-2025-09-15
  • 录音文件识别:
    • fun-asr
    • fun-asr-2025-11-07
    • fun-asr-2025-08-25
    • fun-asr-mtl
    • fun-asr-mtl-2025-08-25

3、Qwen-ASR 系列

  • 实时识别:
    • qwen3-asr-flash-realtime
    • qwen3-asr-flash-realtime-2025-10-27
  • 录音文件识别:
    • qwen3-asr-flash-filetrans
    • qwen3-asr-flash-filetrans-2025-11-17
    • qwen3-asr-flash
    • qwen3-asr-flash-2025-09-08

支持语种包括中文(含粤语、四川话等方言)、英语、日语、韩语、法语、德语、俄语、葡萄牙语、越南语等。

2.4 视频生成与编辑

基于文本或图像生成视频,或对已有视频进行智能编辑,主要包括:

1、文生视频

  • happyhorse-1.0-t2v
  • wan2.7-t2v-2026-04-25

2、图生视频

  • happyhorse-1.0-i2v
  • wan2.7-i2v-2026-04-25

3、视频编辑

  • happyhorse-1.0-video-edit
  • wan2.7-videoedit

上述模型由阿里通义实验室研发,属于“HappyHorse”和“Wan”系列,均为阿里直供模型,可被 B 类节省计划抵扣。

重要排除项:若模型标注为“三方直供”(如某些第三方视频生成模型),则属于 C 类,不支持抵扣。

B 类模型的核心特征

类别功能典型模型前缀/名称是否支持抵扣
图像生成文生图、风格迁移wanx-wan-是(阿里直供)
语音合成TTS(实时/批量)cosyvoice-qwen-tts-
语音识别ASR(实时/文件)paraformer-fun-asr-qwen-asr-
视频生成与编辑T2V、I2V、视频编辑happyhorse-wan2.7-

三、AI通用型节省计划C 类模型参考

C 类模型是指在 AI 通用型节省计划中明确不支持费用抵扣的模型类别,其定义包含两类:一是特定阿里自研模型(如 qwen3.6-max-preview),二是所有三方直供模型(即由第三方厂商部署并上架至百炼平台的模型)。以下是 C 类所涵盖的具体模型清单及分类说明:

3.1 阿里自研但排除在抵扣范围外的模型

  • qwen3.6-max-preview
    • Qwen3.6 系列中规模最大的闭源预览版模型,仅支持纯文本输入,具备思考模式与 Function Calling 能力,但明确被排除在 A/B 类之外,属于 C 类。

注意:其他 qwen3.x-max 正式版(如 qwen3.7-maxqwen3-max)属于 A 类,可抵扣;唯独 qwen3.6-max-preview 因为是“preview”版本而被单独归入 C 类。

3.2 所有三方直供模型

指由非阿里云主体(如月之暗面、智谱 AI、稀宇科技、阶跃星辰、小米等)自行部署并上架至百炼平台的模型实例,无论其基础架构是否源自开源或商业授权,只要部署方非阿里云,即视为“三方直供”,全部归入 C 类,不支持任何节省计划抵扣。

具体包括以下品牌及对应模型:

1. DeepSeek

  • 阿里云直供版本(如 deepseek-v3.2deepseek-r1)属于 A 类,可抵扣;
  • 但若为 DeepSeek 自行部署的模型(如通过 MCP 广场或外部接入),则属于 C 类,不可抵扣。

2. Kimi(月之暗面)

  • 阿里云百炼部署版本(如 kimi-k2.6kimi-k2.5)属于 A 类,可抵扣;
  • 月之暗面自行部署版本(如 kimi/kimi-k2.6kimi/kimi-k2.5Moonshot-Kimi-K2-Instruct)属于 C 类,不可抵扣。

3. GLM(智谱 AI)

  • 阿里云百炼部署版本(如 glm-5.1glm-5)属于 A 类;
  • 智谱 AI 自行部署版本(如 ZHIPU/GLM-5.1ZHIPU/GLM-5)属于 C 类。

4. MiniMax(稀宇科技)

  • 阿里云百炼部署版本(如 MiniMax-M2.5MiniMax-M2.1)属于 A 类;
  • 稀宇科技自行部署版本(如 MiniMax/MiniMax-M3MiniMax/MiniMax-M2.7 等)属于 C 类。

5. HappyHorse

  • “HappyHorse 三方直供模型”属于 C 类;
  • 尽管部分视频/图像生成模型(如 happyhorse-1.0-t2v)在 B 类描述中被提及,但仅限阿里直供版本;
  • 若为第三方通过 HappyHorse 品牌上架的模型(非阿里部署),则归入 C 类,不支持抵扣。

6. 其他三方模型示例

  • MiMo(小米):xiaomi/mimo-v2.5-pro → C 类
  • Stepfun(阶跃星辰):stepfun/step-3.7-flash → C 类

关键判定原则
用户可通过以下方式判断某模型是否属于 C 类:

判定维度属于 C 类(不可抵扣)不属于 C 类(可抵扣)
部署主体模型由第三方(非阿里云)部署由阿里云部署(标注“阿里直供”)
控制台标识无“阿里直供”标签有“阿里直供”标签
模型类型qwen3.6-max-preview(唯一例外的阿里模型)其他千问系列正式版

重要提醒:即使模型名称与阿里直供版本相同,只要部署路径或来源不同,即视为 C 类,无法享受 AI 通用型节省计划的任何折扣抵扣。建议用户在调用前确认模型卡片上的“阿里直供”标识。

四、AI 通用型节省计划扣费说明与不同类型折扣信息参考

4.1 扣费说明

生效时间:可按需选择“开通后立即生效”或“指定时间(按小时)生效”。

承诺周期说明:以月为单位(从生效日到下个月的对应日),月承诺周期结束时,剩余额度自动过期,不可累积到下一周期。举例:如果一次性订阅了 3 个月的节省计划(月承诺额度 1000 元),并非在 3 个月内获得 3000 元总额度,而是每月独立获得 1000 元额度,当月未使用完的部分自动清零,不可累积到下个订阅月。

抵扣范围

  • 支持抵扣:模型调用(输入和输出 Tokens)、模型原生工具调用(如 Function Call、联网搜索、网页抓取等)、上下文缓存、批量推理等产生的费用。
  • 不支持抵扣:模型调优、模型部署的费用,以及 MCP 广场和模型体验的联网搜索的费用。

抵扣逻辑

  • 抵扣顺序:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。
  • 多个同类型的节省计划:优先抵扣先到期的节省计划。若到期时间相同,则优先抵扣先购买的节省计划。
  • 超出部分处理:如果同类节省计划全部到期或额度全部抵扣完后,仍有超出部分,自动转为按量付费。

每月承诺消费金额范围:
用于抵扣模型服务按量计费的每月承诺消费额。可自定义金额,1000 元起,以 10 元为单位调整,不设上限。

承诺周期:
可选择以下四个档位的承诺周期:3个月、6个月、12个月、24个月。

付费方式

  • 全预付:一次性支付整个承诺周期内的全部承诺消费金额,可享最大折扣。
  • 零预付:购买时无需支付,之后按月支付承诺消费金额。零预付需联系商务经理开通白名单后使用。

4.2 折扣信息

不同模型、不同档位、承诺周期和付款方式享受不同的折扣。

例如:选择了为期 12 个月、每月承诺消费 10,000 元的节省计划,采用全预付的方式支付,此时调用千问文本生成模型(A 类)时,享受 8 折优惠,即一次原价 1 元的模型调用,实际从节省计划额度中抵扣 0.8 元。

以下表格中的金额范围含起始值、不含结束值。例如 1,000 - 5,000 表示金额大于等于 1,000 且小于 5,000。

付款方式月承诺金额(元)A类3个月A类6个月A类12个月A类24个月B类3个月B类6个月B类12个月B类24个月C类全周期
全预付[1,000, 5,000)8.8折8.6折8.4折8.2折8.3折8折7.7折7.4折无折扣
全预付[5,000, 10,000)8.6折8.4折8.2折8折8折7.7折7.4折7.1折无折扣
全预付[10,000, 30,000)8.4折8.2折8折7.8折7.7折7.4折7.1折6.8折无折扣
全预付[30,000, 50,000)8.2折8折7.8折7.6折7.4折7.1折6.8折6.5折无折扣
全预付[50,000, 100,000)8折7.8折7.6折7.4折7.1折6.8折6.5折6.2折无折扣
全预付[100,000, 300,000)7.8折7.6折7.4折7.2折6.8折6.5折6.2折5.9折无折扣
全预付[300,000, 1,000,000)7.6折7.4折7.2折7折6.5折6.2折5.9折5.6折无折扣
全预付[1,000,000, ~)7.4折7.2折7折6.8折6.2折5.9折5.6折5.3折无折扣
零预付[1,000, 5,000)9折8.8折8.6折8.4折8.5折8.2折7.9折7.6折无折扣
零预付[5,000, 10,000)8.8折8.6折8.4折8.2折8.2折7.9折7.6折7.3折无折扣
零预付[10,000, 30,000)8.6折8.4折8.2折8折7.9折7.6折7.3折7折无折扣
零预付[30,000, 50,000)8.4折8.2折8折7.8折7.6折7.3折7折6.7折无折扣
零预付[50,000, 100,000)8.2折8折7.8折7.6折7.3折7折6.7折6.4折无折扣
零预付[100,000, 300,000)8折7.8折7.6折7.4折7折6.7折6.4折6.1折无折扣
零预付[300,000, 1,000,000)7.8折7.6折7.4折7.2折6.7折6.4折6.1折5.8折无折扣
零预付1,000,000 及以上7.6折7.4折7.2折7折6.4折6.1折5.8折5.5折无折扣

此外,阿里云还推出了入门型AI通用节省计划,面向新用户提供三档全模型通用抵扣券:全模型通用抵扣20元(新客当月抵扣,直省50%,价格10元/1个月)、全模型通用抵扣100元(新客当月抵扣,直省50%,价格50元/1个月)、全模型通用抵扣500元(新客当月抵扣,直省50%,价格250元/1个月)。详情可通过智启AI普惠权益:https://www.aliyun.com/benefit/ai/discount 等相关活动查阅。

另外,想要便宜购买阿里云AI通用型节省计划,用户可先领取阿里云赠送的优惠券,目前正值阿里云AI加速季活动期间,个人和企业用户可先领取满减优惠券:个人360元,最高可减150元,企业用户1728元,最高可减800元。领券之后可根据订单金额获得一定金额的满减优惠,详情可参考:https://www.aliyun.com/activity/hub/ai-innovation

购买百炼AI通用节省计划也可以使用优惠券抵扣,如下图所示:

小结:阿里云AI通用型节省计划通过A、B、C三类模型的划分,帮助用户精准掌握哪些模型可享折扣、哪些不支持抵扣。A类覆盖阿里直供的千问全系列、开源模型及向量/排序/工具调用能力;B类包含图像生成、语音合成、语音识别及视频生成等多模态服务;C类则明确排除了qwen3.6-max-preview及所有三方直供模型。结合全预付与零预付两种付费方式,A类最高可享6.8折、B类最高可达5.3折,承诺金额越高、周期越长,折扣力度越大。用户在实际调用前,务必通过百炼控制台确认模型的"阿里直供"标识,避免因误选而产生额外成本,从而真正实现大模型推理场景的精细化降本。

本文原创链接:https://www.tengxunyun8.com/19514.html
版权所有,如未注明,均为原创,转载请注明