阿里云AI通用型节省计划:5.3折跨模型抵扣,3-24月周期,阶梯折扣精准控本

阿里云百炼推出多维度计费优惠方案,以AI通用型节省计划为核心,通过承诺月消费金额获取阶梯式折扣,最高可达5.3折,可抵扣阿里直供全部模型,兼具灵活性与成本优势。该计划支持3-24个月承诺周期选择,承诺金额越高、周期越长,折扣力度越大,且支持自动抵扣与续费。其他模型节省计划及资源包虽折扣相对有限,但可按需搭配使用,满足特定场景需求。用户可通过控制台统一管理,实现大模型使用成本的最优化配置。

一、选型指南

可参考以下选型指南快速选择:

  • AI 通用型节省计划推荐):通过承诺每月消费金额来换取阶梯式折扣,最高可享 5.3 折优惠。该方案可抵扣阿里直供的全部模型,灵活性最高,是绝大多数场景下的首选。
  • 其他模型节省计划:一次性购买固定金额,用于抵扣特定模型系列的调用费用。仅适用于部分模型系列(如万相系列、语音模型系列等),且折扣通常不如AI 通用型节省计划,可按需使用。
  • 资源包:一次性购买具体资源量(如Tokens、生成图片数量等)。仅适用于抵扣单个特定模型(例如 qwen-plus),且折扣通常不如 AI 通用型节省计划,可按需使用。

为最大化成本效益,建议优先了解并选择AI通用型节省计划。目前面向所有阿里云用户,提供百余款千问系列大模型和国内优质开源三方大模型,新用户开通即享超7000万免费tokens。体验地址可通过阿里云百炼大模型服务平台了解:https://www.aliyun.com/product/bailian

二、AI 通用型节省计划

2.1 核心优势

AI 通用型节省计划是针对大模型按量付费使用场景设计的折扣方案。只需承诺在一定期限内(3 个月、6 个月、12 个月或 24 个月)的月消费金额,即可在保留按量付费灵活性的基础上,享受阶梯式折扣,优化模型调用成本。其核心优势如下:

  • 覆盖全面:可抵扣阿里直供的全部模型,一次购买即可跨模型使用。
  • 成本优化显著:承诺消费金额越高、周期越长,折扣力度越大,最高可享 5.3 折优惠。
  • 管理流程便捷:购买后可立即或按指定时间生效,无需手动激活或绑定,自动抵扣,支持自动续费。

2.2 使用说明

生效时间:可按需选择“开通后立即生效”或“指定时间(按小时)生效”。
承诺周期说明:以月为单位(从生效日到下个月的对应日),月承诺周期结束时,剩余额度自动过期,不可累积到下一周期。举例:如果一次性订阅了 3 个月的节省计划(月承诺额度 1000 元),并非在 3 个月内获得 3000 元总额度,而是每月独立获得 1000 元额度,当月未使用完的部分自动清零,不可累积到下个订阅月。

抵扣范围:

  • 支持抵扣:模型调用(输入和输出 Tokens)、工具调用、上下文缓存、批量推理等产生的费用。
  • 不支持抵扣:模型调优、模型部署产生的费用。

抵扣逻辑:

  • 抵扣顺序:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。
  • 多个同类型的节省计划:优先抵扣先到期的节省计划。若到期时间相同,则优先抵扣先购买的节省计划。
  • 超出部分处理:如果同类节省计划全部到期或额度全部抵扣完后,仍有超出部分,自动转为按量付费。

2.3 购买指引

首先购买AI 通用型节省计划:https://common-buy.aliyun.com/?commodityCode=sfm_GenAI_spn_cn

购买方式购买 AI 通用型节省计划
适用地域华北2(北京)、美国(弗吉尼亚)、新加坡
支持的抵扣范围不同档位享受不同的折扣。 - A 类:千问、千问-开源、文本向量、多模态向量、排序模型、行业模型、工具调用(Function Calling)、联网搜索、网页抓取等) - B 类:图像生成、语音合成、语音识别与翻译、视频生成与编辑 - C 类:DeepSeek、Kimi、GLM、MiniMax > 三方直供模型不支持抵扣。
每月承诺消费金额用于抵扣模型服务按量计费的每月承诺消费额。可自定义金额,1000 元起,以 10 元为单位调整,不设上限。
承诺周期可选择以下四个档位的承诺周期:3个月、6个月、12个月、24个月
付费方式- 全预付:一次性支付整个承诺周期内的全部承诺消费金额,可享最大折扣。 - 零预付:购买时无需支付,之后按月支付承诺消费金额。零预付需联系商务经理开通白名单后使用。
折扣请参考下文折扣信息。
开通时间选择可按需选择“开通后立即生效”或“指定时间(按小时)生效”。

2.4 折扣信息

不同模型、不同档位、承诺周期和付款方式享受不同的折扣。

例如:选择了为期 12 个月、每月承诺消费 10,000 元的节省计划,采用全预付的方式支付,此时调用千问文本生成模型(A 类)时,享受 8 折优惠,即一次原价 1 元的模型调用,实际从节省计划额度中抵扣 0.8 元。

付款方式月承诺金额(元)A类3个月A类6个月A类12个月A类24个月B类3个月B类6个月B类12个月B类24个月C类全周期
全预付[1,000, 5,000)8.8折8.6折8.4折8.2折8.3折8折7.7折7.4折无折扣
全预付[5,000, 10,000)8.6折8.4折8.2折8折8折7.7折7.4折7.1折无折扣
全预付[10,000, 30,000)8.4折8.2折8折7.8折7.7折7.4折7.1折6.8折无折扣
全预付[30,000, 50,000)8.2折8折7.8折7.6折7.4折7.1折6.8折6.5折无折扣
全预付[50,000, 100,000)8折7.8折7.6折7.4折7.1折6.8折6.5折6.2折无折扣
全预付[100,000, 300,000)7.8折7.6折7.4折7.2折6.8折6.5折6.2折5.9折无折扣
全预付[300,000, 1,000,000)7.6折7.4折7.2折7折6.5折6.2折5.9折5.6折无折扣
全预付[1,000,000, ~)7.4折7.2折7折6.8折6.2折5.9折5.6折5.3折无折扣
零预付[1,000, 5,000)9折8.8折8.6折8.4折8.5折8.2折7.9折7.6折无折扣
零预付[5,000, 10,000)8.8折8.6折8.4折8.2折8.2折7.9折7.6折7.3折无折扣
零预付[10,000, 30,000)8.6折8.4折8.2折8折7.9折7.6折7.3折7折无折扣
零预付[30,000, 50,000)8.4折8.2折8折7.8折7.6折7.3折7折6.7折无折扣
零预付[50,000, 100,000)8.2折8折7.8折7.6折7.3折7折6.7折6.4折无折扣
零预付[100,000, 300,000)8折7.8折7.6折7.4折7折6.7折6.4折6.1折无折扣
零预付[300,000, 1,000,000)7.8折7.6折7.4折7.2折6.7折6.4折6.1折5.8折无折扣
零预付1,000,000 及以上7.6折7.4折7.2折7折6.4折6.1折5.8折5.5折无折扣

说明:零预付需联系商务经理开通。

2.5 生命周期管理

访问节省计划总览页面管理节省计划。

1.节省计划续订
登录费用与成本控制台,左侧菜单选择费用 > 我的订阅,查看并管理节省计划的订阅状态、生效时间、自动续费状态等。

2.查询折扣
在 AI 通用型节省计划中,不同模型、不同档位、承诺周期和付款方式享受不同的折扣。可以访问节省计划价格折扣详情页面,按以下条件筛选查询:

  • 适用商品:参考下表选择对应的商品名称。
  • 被抵扣计费项:参考下表选择对应的计费项。
  • 节省计划类型:选择 AI 通用型节省计划/百炼AI通用型节省计划。
  • 订购时长和支付方式:选择对应的选项,查看按量折扣。
适用商品被抵扣计费项
百炼大模型推理文本:文本生成Token用量 图片:图片生成张数用量、多规格图片生成张数用量、图片检测张数用量 视频:视频生成时长用量 语音:语音合成字数用量、语音识别时长用量、Cosyvoice语音合成字数用量、声音复刻及声音设计模型个数用量 向量:多模态向量模型用量、文本向量模型用量 批量调用:Batch模型用量、BatchChat模型用量、BatchChat Token用量、BatchChat视频生成时长用量 工具调用:计次用量 以及上述各计费项对应的全局用量。 > 查询华北2(北京)地域的调用费用折扣时,选择非全局计费项;查询其他地域时,选择对应的全局计费项。
百炼大模型-垂类模型文本生成Token用量
阿里云百炼大模型-向量排序模型多模态向量模型用量
百炼大模型-千问语音模型语音合成字数用量、语音识别时长用量
百炼大模型-百聆语音模型语音合成字数用量、语音识别时长用量
百炼大模型-万相模型图片生成张数用量、视频生成时长用量

3.查询账单
进入费用与成本控制台,左侧菜单选择账单 > 账单详情,产品名称选择大模型服务平台百炼,商品名称选择 AI 通用型节省计划。页面默认展示当月明细账单。

三、其他模型节省计划

与 AI 通用型节省计划相比,其他模型节省计划更适合用量较小或需求高度集中于某一特定模型的场景。

3.1 使用说明

生效时间:节省计划购买后立即生效。
有效期说明:有效期根据购买套餐而定。超出有效期后,节省计划中剩余的金额,将无法使用,不支持退款。
抵扣范围:支持抵扣模型调用费用(输入和输出 Tokens)。不支持抵扣工具调用、上下文缓存、批量推理等产生的费用。不支持抵扣模型调优、模型部署产生的费用。

抵扣逻辑:

  • 抵扣顺序:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。
  • 多个同类型的节省计划:优先抵扣先到期的节省计划。若到期时间相同,则优先抵扣先购买的节省计划。
  • 超出部分处理:如果同类节省计划全部到期或额度全部抵扣完后,仍有超出部分,自动转为按量付费。

四、支持的节省计划

1.大语言模型

购买方式购买大语言模型推理节省计划
档位阿里云百炼提供购买的档位包括:20元、100元、1,000元、5,000元、10,000元、20,000元、50,000元、100,000元、200,000元、300,000元、500,000元。
折扣上述档位均无折扣,按模型调用价格进行扣费。
有效期- 对于20元档,有效期1个月。 - 对于100元档,有效期3个月。 - 对于1,000元档,有效期6个月。 - 对于5,000元、10,000元、20,000元、50,000元、100,000元、200,000元、300,000元、500,000元八档,有效期1年。
适用地域华北2(北京)
适用模型适用于已上架阿里云百炼平台并以 Token 计费的文本生成模型,模型范围包括: - 通用大语言模型: - 商业版:千问 Max、千问 Plus、千问 Flash、千问 Turbo、QwQ、千问 Long - 开源版:Qwen3.5、Qwen3、QwQ、QwQ-Preview、Qwen2.5、Qwen-Math、Qwen-Coder - 第三方模型:DeepSeek、GLM、Kimi、MiniMax - 多模态模型: - 商业版:千问Omni、千问Omni-Realtime、QVQ、千问VL、千问OCR - 开源版:Qwen-Omni、Qwen3-Omni-Captioner、Qwen-VL、QVQ - 领域模型:千问Coder、千问翻译模型、千问数据挖掘模型、千问深入研究模型

2.万相模型

购买方式购买万相模型节省计划
购买说明阿里云百炼提供五个购买档位,分别为: - 20元:无折扣 - 100元:无折扣 - 1,000元:享 9.8 折优惠 - 10,000元:享 9.5 折优惠 - 30,000元:享 9 折优惠 优惠示例:以 1,000元 档位为例,假设生成某个视频消费1元,实际将从节省计划中抵扣1\*0.98=0.98元。
有效期- 对于20元、100元两档,有效期3个月。 - 对于1,000元、10,000元、30,000元三档,有效期6个月。
适用模型图像生成:wan2.6-image、wan2.6-t2i、wan2.5-t2i-preview、wan2.5-i2i-preview、wan2.2-t2i-plus、wan2.2-t2i-flash、wanx2.0-t2i-turbo、wanx2.1-t2i-plus、wanx2.1-imageedit、wanx2.1-t2i-turbo、wanx-sketch-to-image-lite、wanx-v1 视频生成:wan2.6-t2v、wan2.6-i2v、wan2.6-r2v、wan2.5-t2v-preview、wan2.5-i2v-preview、wan2.2-t2v-plus、wan2.2-i2v-flash、wan2.2-t2v-flash、wan2.2-i2v-plus、wanx2.1-vace-plus、wanx2.1-kf2v-plus、wanx2.1-t2v-turbo、wanx2.1-t2v-plus、wanx2.1-i2v-turbo、wanx2.1-i2v-plus。

3.千问语音模型

购买方式购买千问语音模型节省计划
购买说明阿里云百炼提供五个购买档位,分别为: - 20元:享 9.8 折优惠 - 100元:享 9.6 折优惠 - 500元:享 9 折优惠 - 1,000元:享 8.5 折优惠 - 5,000元:享 8 折优惠 优惠示例:以 1,000元 档位为例,假设消费1元,实际将从节省计划中抵扣1\*0.85=0.85元。 ASR模型按秒计费,TTS模型按字符计费。
有效期- 对于20元、100元两档,有效期为6个月。 - 对于500元、1,000元、5,000元三档,有效期可选 6 个月或 12 个月。
适用模型因地域而异: - 华北2(北京): - 实时语音合成(CosyVoice):cosyvoice-v3-plus、cosyvoice-v3-flash、cosyvoice-v2、cosyvoice-v1 - 实时语音合成(Qwen-TTS-Realtime):qwen3-tts-flash-realtime、qwen3-tts-flash-realtime-2025-09-18、qwen-tts-realtime、qwen-tts-realtime-latest、qwen-tts-realtime-2025-07-15 - 语音合成(Qwen-TTS):qwen3-tts-flash、qwen3-tts-flash-2025-09-18、qwen-tts、qwen-tts-latest、qwen-tts-2025-05-22、qwen-tts-2025-04-10 - 实时语音识别(Paraformer):paraformer-realtime-v2、paraformer-realtime-v1、paraformer-realtime-8k-v2、paraformer-realtime-8k-v1 - 实时语音识别(Fun-ASR):fun-asr-realtime、fun-asr-realtime-2025-11-07、fun-asr-realtime-2025-09-15 - 实时语音识别(Qwen-ASR-Realtime):qwen3-asr-flash-realtime、qwen3-asr-flash-realtime-2025-10-27 - 实时长语音识别/翻译(Gummy):gummy-realtime-v1 - 实时短语音(一句话)识别/翻译(Gummy):gummy-chat-v1 - 录音文件识别(Paraformer):paraformer-v2、paraformer-v1、paraformer-8k-v2、paraformer-8k-v1、paraformer-mtl-v1 - 录音文件识别(Fun-ASR):fun-asr、fun-asr-2025-11-07、fun-asr-2025-08-25、fun-asr-mtl、fun-asr-mtl-2025-08-25 - 录音文件识别(Qwen-ASR):qwen3-asr-flash-filetrans、qwen3-asr-flash-filetrans-2025-11-17、qwen3-asr-flash、qwen3-asr-flash-2025-09-08 - 录音文件识别(SenseVoice):sensevoice-v1 - 新加坡: - 实时语音合成(Qwen-TTS-Realtime):qwen3-tts-flash-realtime、qwen3-tts-flash-realtime-2025-09-18 - 语音合成(Qwen-TTS):qwen3-tts-flash、qwen3-tts-flash-2025-09-18 - 实时语音识别(Qwen-ASR-Realtime):qwen3-asr-flash-realtime、qwen3-asr-flash-realtime-2025-10-27 - 录音文件识别(Fun-ASR):fun-asr、fun-asr-2025-11-07、fun-asr-2025-08-25 - 录音文件识别(Qwen-ASR):qwen3-asr-flash-filetrans、qwen3-asr-flash-filetrans-2025-11-17、qwen3-asr-flash、qwen3-asr-flash-2025-09-08 请前往百炼控制台查看全部模型。

4.向量及排序模型

购买方式购买向量及排序模型服务节省计划
购买说明阿里云百炼提供五个购买档位,分别为: - 100元:无折扣 - 500元:享 9 折优惠 - 2,000元:享 8 折优惠 - 5,000元:享 7.5 折优惠 - 10,000元:享 7 折优惠 优惠示例:以 1,000元 档位为例,假设消费 1 元,实际将从节省计划中抵扣1\*0.75=0.75(元)。
有效期- 对于100元、500元档位,有效期3个月。 - 对于2,000元档位,有效期6个月。 - 对于5,000元、10,000元档位,有效期12个月。
适用地域华北2(北京)
适用模型文本向量:text-embedding-v4、text-embedding-v3、text-embedding-v2、text-embedding-v1、text-embedding-async-v2、text-embedding-async-v1 多模态向量:qwen2.5-vl-embedding、tongyi-embedding-vision-plus、tongyi-embedding-vision-flash、multimodal-embedding-v1 文本排序:qwen3-rerank、gte-rerank-v2。

五、资源包

预先购买的是具体的 Token 数量,用于抵扣特定模型超出免费额度后产生的实时推理用量。

5.1使用说明

生效时间:资源包购买后立即生效,无需手动“激活”或“绑定”。
有效期说明:有效期根据购买套餐而定。超出有效期后,资源包中剩余的Tokens,自动作废。

抵扣逻辑:

  • 抵扣顺序:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。
  • 多个同类型的资源包:优先抵扣先到期的资源包。若到期时间相同,则优先抵扣先购买的资源包。
  • 超出部分处理:如果同类资源包全部到期或额度全部抵扣完后,若仍有超出部分,自动转为按量付费。

余量监控与预警:

  • 查看余量:点击资源包查看剩余量情况,点击统计查看使用信息。
  • 设置预警:建议设置资源包余量预警。当资源包使用量低于预设阈值时,系统将通过短信、邮件及站内信自动触发通知。

退订说明:

  • 根据退订规则,预付费商品未发生使用的部分,可按未使用额度费用申请退款;已使用的部分则无法退款。

5.2大语言模型推理资源包

订购资源包大语言模型推理资源包 qwen-plus大语言模型推理资源包 qwen-max大语言模型推理资源包 qwen-turbo
适用地域华北2(北京)华北2(北京)华北2(北京)
适用模型qwen-plus 及 qwen-plus-latest 的实时推理服务qwen-max及qwen-max-latest 的实时推理服务qwen-turbo及qwen-turbo-latest 的实时推理服务
包含输入和输出总Tokens1,200万/1.1亿1,800万/3,900万/3.9亿/11.7亿/19.5亿3,500万/3.5亿/17.5亿/35亿
价格(元)11.66/114.457.6/125/1250/3750/625011.45/114.45/572.25/1144.5
有效期自购买日起生效,有效期可选 3 个月、6 个月或 1 年。自购买之日起有效期为 1 年。自购买之日起有效期为 1 年。

使用限制说明:

  • qwen-plus、qwen-plus-latest
  • 仅支持抵扣单次请求输入在0<Token≤128K阶梯范围内的实时推理费用,包含输入和输出。
  • 不支持抵扣的费用包括:
  • 单次请求输入在Token>128K阶梯范围产生的费用。
  • Batch调用、上下文缓存、模型调优、模型部署产生的费用。
  • qwen-max、qwen-max-latest、qwen-turbo、qwen-turbo-latest
  • 仅支持抵扣实时推理产生的费用,包含输入和输出),不支持抵扣Batch调用、上下文缓存、模型调优、模型部署产生的费用。

5.3图像生成模型资源包

订购资源包千问图像生成模型资源包qwen-image千问图像生成模型资源包qwen-image-plus
适用地域华北2(北京)华北2(北京)
适用模型文生图:qwen-image 图像编辑:qwen-image-edit文生图:qwen-image-plus 图像编辑:qwen-image-edit-plus
资源包容量 (生成图片张数)80/400100/1,000/10,000/100,000/500,000
价格(元)20/100享阶梯折扣: 20/196(9.8折)/1,900(9.5折)/18,000(9折)/85,000(8.5折)
有效期自购买之日起有效期为 3 个月。对于100、1,000张档位,自购买之日起有效期为3个月。 对于10,000、100,000张档位,自购买之日起有效期为6个月。 对于500,000张档位,自购买之日起有效期为12个月。
说明使用文生图模型生成一张图片消耗 1 张额度,使用图片编辑模型编辑一张图片消耗 1.2 张额度。 资源包容量耗尽后,将自动转为按量付费模式,超出部分按各模型对应的价格进行计费。生成或编辑一张图片消耗 1 张额度。 资源包容量耗尽后,将自动转为按量付费模式,超出部分按各模型对应的价格进行计费。

六、常见问题

1.节省计划和资源包是否支持退订?

  • 节省计划:自 2026 年 04 月 03 日 10:00:00(UTC+8)起,符合以下条件的节省计划支持自助退订,可在资源退订控制台中操作:
    • 未生效的全预付节省计划。
    • 已生效但未发生任何抵扣的全预付节省计划。
      若购买的节省计划已发生抵扣,暂不支持退订。
  • 资源包:未发生使用的部分,可按未使用额度费用申请退款;已使用的部分则无法退款。

2.资源包和节省计划如果同时存在,怎么扣费?
系统的抵扣优先级为:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。即:先用免费额度;用完后扣资源包;资源包不够或不适用时,扣节省计划;最后才使用账户余额。

3.为什么购买了节省计划,但没有抵扣?
常见原因如下:

  1. 模型不匹配:购买了其他节省计划,但调用的模型不在适用范围内。例如:购买了大语言模型节省计划,却调用了万相系列模型。可以选择购买 AI 通用型节省计划以实现跨模型调用。
  2. 使用了不支持的功能:AI 通用型节省计划和其他节省计划均不支持抵扣模型调优、模型部署费用。只有 AI 通用型节省计划支持抵扣上下文缓存、批量推理、工具调用等产生的费用,而其他节省计划不支持。
  3. 免费额度未用完:系统抵扣顺序为:免费额度 > 节省计划。节省计划仅抵扣免费额度用尽后产生的账单。

4.三方直供模型支持抵扣 AI 通用型节省计划吗?
C 类模型中,阿里直供的模型支持抵扣,三方直供的模型不支持抵扣。可以在百炼模型广场中通过模型卡片右上角标识判断。

5.为什么购买了资源包,但没有抵扣?
资源包的抵扣需要满足特定条件,常见原因如下:

  1. 模型不匹配:调用的模型与购买的资源包不一致。例如,购买 qwen-max 资源包却调用了 qwen-plus 模型。
  2. 使用了不支持的功能:资源包不支持抵扣这些功能产生的费用:批量推理(Batch)、上下文缓存、模型调优、模型部署。
  3. Token 长度超限:对于 qwen-plus 资源包,单次请求输入超过 128K Token 的部分无法抵扣。
  4. 免费额度未用完:系统抵扣顺序为:免费额度 > 资源包。资源包仅抵扣免费额度用尽后产生的账单。
    6.如果先购买了资源包但未开通阿里云百炼服务,应该如何使用?
    请先开通阿里云百炼的模型服务。服务开通后,优先会抵扣免费额度,待免费额度消耗完后,才会开始抵扣资源包。

2026阿里云服务器热门活动直达:
1、轻量应用服务器2核2G38元1年,2核4G9.9元1个月、199元1年抢购,通用算力型u2i、计算型c9i、通用型g9i、内存型r9i实例云服务器活动直达:阿里云服务器爆款直降90%,89元享4核16G强劲配置

2、gpu云服务器专属活动直达:阿里云gpu云服务器按量1折,包月5折起,包年4折起

3、阿里云服务器2核2G99元1年、2核4G199元1年和7.5折优惠券,没有套路真的能减:阿里云官方云小站平台

上文系统梳理了阿里云百炼平台大模型成本优化方案,涵盖AI通用型节省计划、其他模型节省计划及资源包三大核心计费优惠工具。AI通用型节省计划以最高5.3折阶梯式折扣、跨模型通用抵扣及灵活承诺周期(3-24个月)成为首选方案;其他模型节省计划聚焦特定模型场景,提供差异化折扣;资源包则通过预购Token/图片量实现精准成本控制。用户可根据业务需求,结合免费额度、抵扣优先级及生命周期管理策略,实现大模型使用成本的最优化配置,助力企业高效部署AI应用。

本文原创链接:https://www.tengxunyun8.com/18744.html
版权所有,如未注明,均为原创,转载请注明