阿里云百炼大模型服务平台部署全攻略:训练低至0.003元/千Token,新用户还享7000万免费Tokens

随着大模型技术的快速发展,阿里云百炼平台已成为企业落地AI应用的重要选择。无论是使用千问系列文本模型进行微调训练,还是调用万相视频生成模型,了解清晰的计费规则都是控制成本的关键。本文详细介绍了百炼平台在模型训练与部署两大环节的计费规则及价格:训练方面,千问系列按Token计费,单价从0.003元至0.15元/千Token不等,万相则按训练Token总量综合计算;部署方面,提供按时长、按Token用量及按实例时长等多种计费方式,覆盖千问、千问VL、万相等主流模型。文章还附有计费示例与常见问题解答,助您合理规划AI应用预算。

一、模型训练计费

阿里云百炼平台目前面向所有阿里云用户,提供百余款千问系列大模型和国内优质开源三方大模型,新用户开通即享超7000万免费tokens。详情可参考:https://www.aliyun.com/product/bailian

1.1 文本生成模型-千问

说明:模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能评测和调用。

计费方式按训练Token计费
计费公式模型训练费用 =(训练数据 Token 总数 + 混合训练数据 Token 总数)× 循环次数 × 训练单价(最小计费单位:1 token)
您可以查看模型训练控制台底部的预估训练费用,并单击计算详情,查看训练 Token 总数、循环次数和训练单价。

千问

模型服务模型规格价格
千问2.5-72Bqwen2.5-72b-instruct0.15元/千Token
Qwen-Plus-character-2025-11-06qwen-plus-character-2025-11-06-
千问3-32Bqwen3-32b0.04 元/千Token
千问3-32B-Baseqwen3-32b-base-
千问3-30B-A3B-Instruct-2507qwen3-30b-a3b-instruct-25070.03元/千 Token
千问3-14Bqwen3-14b-
千问3-14B-Baseqwen3-14b-base-
千问2.5-32Bqwen2.5-32b-instruct-
千问2.5-14Bqwen2.5-14b-instruct-
千问3-8Bqwen3-8b0.006元/千 Token
千问3-8B-Baseqwen3-8b-base-
千问3-4B-Instruct-2507qwen3-4b-instruct-2507-
千问3-4B-Base-2507qwen3-4b-base-2507-
千问3-VL-4B-Instructqwen3-vl-4b-instruct-
千问2.5-7Bqwen2.5-7b-instruct-
千问3-1.7Bqwen3-1.7b0.0045元/千Token
千问3-0.6Bqwen3-0.6b0.003元/千Token

千问VL

模型服务模型规格价格
千问2.5-VL-72Bqwen2.5-vl-72b-instruct0.05 元/千Token
千问2.5-VL-32Bqwen2.5-vl-32b-instruct0.02 元/千Token
千问3-VL-8B-Instructqwen3-vl-8b-instruct0.012元/千Token
千问3-VL-8B-Thinkingqwen3-vl-8b-thinking-
千问3-VL-8B-Baseqwen3-vl-8b-base-
千问2.5-VL-7Bqwen2.5-vl-7b-instruct0.01 元/千Token
千问3-VL-1B-Baseqwen3-vl-1b-base0.003元/千Token

1.2 视频生成模型-万相

说明:模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能调用。

计费方式按训练Token计费
计费公式模型训练费用 = 训练Token总量 × 训练单价(计费单位:每千Token)

训练Token总量的计算公式

其中:

  • N:训练集中的视频总数。
  • max_pixels:训练时指定的超参数,表示视频的最大像素数(创建微调任务时配置)。
  • n_epochs:训练时指定的超参数,表示循环次数(创建微调任务时配置)。
  • 单个视频计费时长计算规则:先将原始视频时长(秒)四舍五入取整,再根据模型限制取最终值。
    • wan2.5模型:计费时长 = min(10, 四舍五入后的时长),即单条视频最多按 10 秒计算。
    • wan2.2模型:计费时长 = min(5, 四舍五入后的时长),即单条视频最多按 5 秒计算。
模型服务模型名称训练价格(每千Token)
万相-图生视频-基于首帧wan2.2-i2v-flash0.06元
wan2.5-i2v-preview0.32元
图生视频-基于首尾帧wan2.2-kf2v-flash0.06元

计费示例

假设训练集包含 2 条视频,时长分别为 3.4 秒 和 6.5 秒,max_pixels = 262144,n_epochs = 400,训练单价 = 0.06元/千Token:

  • 时长计算:
    • 视频 1:3.4 → 四舍五入 → 3 秒 → 计费时长 = min(5, 3) = 3
    • 视频 2:6.5 → 四舍五入 → 7 秒 → 计费时长 = min(5, 7) = 5
    • 总计费时长 = 3 + 5 = 8 秒
  • 训练Token总量 = 8 ×(262144/1024)× 400 = 819200 = 819.2千Token
  • 模型训练费用 = 819.2 × 0.06 = 49.152元

二、模型部署计费

2.1 文本生成模型-千问

按使用时长计费(预置吞吐)

费用 = 使用时长 × (输入 TPM 单价 × 输入 TPM + 输出 TPM 单价 × 输出 TPM)

  • 预付费订单支付后实时生效,有效期 N 天至第 N 天 23:59 结束。若在 22:00 后下单,到期日将自动顺延1天。
  • 预付费订单到期后,将延后2小时停止服务,停止后资源保留14小时后释放。
  • 预付费订单无法提前终止服务。
  • 后付费时,如果账户欠费,部署的资源将保留并继续计费 24 小时,之后自动释放资源。

当模型输入超过最长输入 Token 或 超出购买的 TPM 量时,相关调用将自动切换为当前模型的按量付费模式。此时,推理性能可能下降,限流将受业务空间中当前快照模型的公共流量的管控,费用按模型调用(按量付费)标准计收。

  • 此时,调用 API 返回 Header 将包含:x-dashscope-ptu-overflow:true
  • TPM 统计请前往:模型监控(北京)。
模型名称模型代码思考模式最长输入Token限制后付费-按小时-输入(Per 10k TPM)后付费-按小时-输出(Per 1k TPM)预付费-按天-输入(Per 10k TPM)预付费-按天-输出(Per 1k TPM)
DeepSeek-v4-prodeepseek-v4-pro支持64,000¥43.20¥8.64¥518.40¥103.68
GLM-5.1glm-5.1支持64,000¥21.60¥8.64¥259.20¥103.68
千问3.6-Plus-2026-04-02qwen3.6-plus-2026-04-02支持128,000¥4.80¥2.88¥57.60¥34.56
千问3.5-plus-2026-04-20qwen3.5-plus-2026-04-20支持128,000¥1.92¥1.15¥23.04¥13.82
千问3-max-2025-09-23qwen3-max-2025-09-23不支持128,000¥7.68¥3.08¥92.16¥36.96
千问-plus-2025-12-01qwen-plus-2025-12-01不支持-¥1.92¥0.48¥23.04¥5.76
千问-plus-2025-12-01qwen-plus-2025-12-01支持-¥1.92-¥23.04-
千问-flash-2025-07-28qwen-flash-2025-07-28支持-¥0.36¥0.36¥4.32¥4.32
千问3-vl-plus-2025-09-23qwen3-vl-plus-2025-09-23支持-¥2.40¥2.40¥28.80¥28.80
DeepSeek-v3.2deepseek-v3.2支持64,000¥7.20¥1.08¥86.40¥12.96

按使用时长计费(模型单元)

费用 = 使用时长(小时)× 模型单元数量 × 模型单元单价

  • 预付费购买的首月,如在首月内提前退订,日单价将按 1.2 倍计费

说明:模型单元-后付费方式的算力资源先买到先得。如购买不成功会全额退款。

千问
模型名称模型代码模型类型支持限流模型单元规格后付费-按小时预付费-按天
千问3.6-Plus-2026-04-02qwen3.6-plus-2026-04-02Thinking支持I 型模型单元(MU1)¥432/小时¥208,944/月
千问3.5-Plus-2026-02-15qwen3.5-plus-2026-02-15Instruct支持III 型模型单元(MU3)¥1,048/小时(PD分离模式:¥2,096/小时)¥504,000/月(PD分离模式:¥1,008,000/月)
Qwen2.5-14B-Instructqwen2.5-14b-instructInstruct支持I 型模型单元(MU1)¥108/小时¥52,236/月
GLM-5glm-5Instruct支持III 型模型单元(MU3)¥1,048/小时(PD分离模式:¥2,096/小时)¥504,000/月(PD分离模式:¥1,008,000/月)
千问3.5-397B-A17Bqwen3.5-397b-a17bInstruct支持III 型模型单元(MU3)¥1,048/小时(PD分离模式:¥2,096/小时)¥504,000/月(PD分离模式:¥1,008,000/月)
千问3-Max-2025-09-23qwen3-max-2025-09-23Instruct支持II 型 / III 型模型单元(MU2/MU3)II型:¥504/小时;III型:¥1,048/小时II型:¥240,288/月;III型:¥504,000/月
DeepSeek-v3.2deepseek-v3.2Instruct支持II 型模型单元(MU2)¥504/小时(PD分离模式:¥896/小时)¥240,288/月(PD分离模式:¥432,000/月)
千问3-235B-A22B-Instruct-2507qwen3-235b-a22b-instruct-2507Instruct支持I / II 型模型单元(MU1/MU2)I型:¥216/小时;II型:¥448/小时I型:¥104,472/月;II型:¥216,000/月
千问-Plus-2025-12-01qwen-plus-2025-12-01Instruct/Thinking支持I 型模型单元(MU1)¥216/小时¥104,472/月
千问-Plus-2025-07-28qwen-plus-2025-07-28Instruct/Thinking支持---
千问-Flash-2025-07-28qwen-flash-2025-07-28Instruct/Thinking支持---
千问2.5-开源版-72Bqwen2.5-72b-instructInstruct支持---
千问2.5-开源版-32Bqwen2.5-32b-instructInstruct支持---
千问3-32Bqwen3-32bInstruct支持---
qwen3.5-35b-a3bqwen3.5-35b-a3bThinking支持I 型模型单元(MU1)¥108/小时¥52,236/月
千问3.5-9Bqwen3.5-9bInstruct支持I 型模型单元(MU1)¥108/小时¥52,236/月
千问3.5-27Bqwen3.5-27bInstruct支持---
千问3-Next-80B-A3B-Instructqwen3-next-80b-a3b-instructInstruct支持---
qwen3.5-122b-a10bqwen3.5-122b-a10bThinking支持I 型模型单元(MU1)¥216/小时¥104,472/月
千问3-4Bqwen3-4bInstruct支持V / I 型模型单元(MU5/MU1)V型:¥20/小时;I型:¥96/小时V型:¥9,500/月;I型:¥46,000/月
千问3-1.7Bqwen3-1.7bInstruct支持V / I 型模型单元(MU5/MU1)V型:¥20/小时;I型:¥96/小时V型:¥9,500/月;I型:¥46,000/月
Text Embedding V4text-embedding-v4Embedding支持V 型模型单元(MU5)¥20/小时¥9,500/月
千问2.5-开源版-3Bqwen2.5-3b-instructInstruct支持---
千问3-Rerankqwen3-rerankRerank支持---
千问3-MoE-Rerank-0.6Bqwen3-moe-rerank-0.6bRerank支持---
千问3-Rerank-0.6Bqwen3-rerank-0.6bRerank支持V / VI 型模型单元(MU5/MU6)V型:¥20/小时;VI型:¥18/小时V型:¥9,500/月;VI型:¥8,700/月
千问3-Embedding-0.6Bqwen3-embedding-0.6bEmbedding支持VI / V 型模型单元(MU6/MU5)VI型:¥25/小时;V型:¥20/小时VI型:¥12,089/月;V型:¥9,500/月
MiniMax-M2.5MiniMax-M2.5Instruct支持I 型模型单元(MU1)¥432/小时¥208,944/月
kimi-k2.5kimi-k2.5Thinking支持II 型模型单元(MU2)¥504/小时¥240,288/月

模型类型说明

  • Instruct - 模型部署后以非思考模式进行推理。
  • Thinking - 模型部署后以思考模式进行推理。

模型部署类型说明

  • PD 分离模式 - 降低首 Token 延迟、提高吞吐。该部署模式部署的模型在进行模型推理时,将首 Token 计算(Prefill)和后续 Token 计算(Decode)两个计算阶段,拆到不同的计算节点执行。
千问VL
模型服务模型代码模型类型支持限流模型单元规格单价(不满1分钟按1分钟计费)包月单价(不满1天按1天计费)
千问VL-Max-2025-08-13qwen-vl-max-2025-08-13Instruct支持VI 型模型单元(MU6)¥100/小时¥48,356/月
千问VL-OCR-2025-11-20qwen-vl-ocr-2025-11-20Instruct支持VI 型模型单元(MU6)--
千问3-VL-8B-Instructqwen3-vl-8b-instructInstruct支持I 型模型单元(MU1)¥108/小时;¥96/小时¥52,236/月;¥46,000/月
千问3-VL-4B-Instructqwen3-vl-4b-instructInstruct支持---
千问3-VL-Flash-2025-10-15qwen3-vl-flash-2025-10-15Instruct/Thinking支持I 型模型单元(MU1)¥216/小时¥104,472/月
千问3-VL-Plus-2025-09-23qwen3-vl-plus-2025-09-23Instruct/Thinking支持---
千问3-VL-235B-A22B-Instructqwen3-vl-235b-a22b-instructInstruct支持---
千问3-VL-32B-Instructqwen3-vl-32b-instructInstruct支持---
千问3-VL-Embedding-2Bqwen3-vl-embedding-2bEmbedding支持V 型模型单元(MU5)¥20/小时¥9,500/月
qwen3-vl-2b-instructqwen3-vl-2b-instructThinking-V 型模型单元(MU5)¥20/小时¥9,500/月

模型类型说明

  • Instruct - 模型部署后以非思考模式进行推理。
  • Thinking - 模型部署后以思考模式进行推理。
  • Instruct/Thinking - 可在模型部署时选择是否开启思考模式。

按模型 Token 使用量

费用 = 模型输入 Token 数 × 模型输入单价 + 模型输出 Token 数 × 模型输出单价(最小计费单位:1 token)

  • 仅当对下列基础模型完成 SFT 高效训练并得到自定义模型后,才支持按模型 Token 使用量计费。
基础模型模型代码模型类型最长上下文输入单价输出单价
千问3-32Bqwen3-32bInstruct固定为:131,072¥0.002/千Token非思考模式:¥0.008/千Token;思考模式:¥0.02/千Token
千问3-14Bqwen3-14bInstruct-¥0.001/千Token非思考模式:¥0.004/千Token;思考模式:¥0.01/千Token
千问3-8Bqwen3-8bInstruct-¥0.0005/千Token非思考模式:¥0.002/千Token;思考模式:¥0.005/千Token
千问3-VL-8B-Instructqwen3-vl-8b-instructInstruct固定为:131,072¥0.0005/千Token¥0.002/千Token
千问 2.5-72Bqwen2.5-72b-instructInstruct固定为:131,072¥0.004/千Token¥0.012/千Token
千问 2.5-32Bqwen2.5-32b-instructInstruct-¥0.002/千Token¥0.006/千Token
千问 2.5-14Bqwen2.5-14b-instructInstruct-¥0.001/千Token¥0.003/千Token
千问 2.5-7Bqwen2.5-7b-instructInstruct-¥0.0005/千Token¥0.001/千Token
千问2.5-VL-72Bqwen2.5-vl-72b-instructInstruct固定为:131,072¥0.016/千Token¥0.048/千Token
千问2.5-VL-32Bqwen2.5-vl-32b-instructInstruct-¥0.008/千Token¥0.024/千Token
千问2.5-VL-7Bqwen2.5-vl-7b-instructInstruct-¥0.002/千Token¥0.005/千Token
千问 2-开源版-7Bqwen2-7b-instructInstruct固定为:131,072¥0.001/千Token¥0.002/千Token

图片、视频生成模型(预置)-按实例时长计费

费用 = 资源占用时长(小时)× 实例数量 × 实例单价(不满 1 小时按 1 小时计费)

图片生成
模型服务模型类型独占实例资源规格后付费单价预付费单价
万相-文本生成图像-0521预置模型轻量版¥20/实例/小时¥10,000/月
视频生成
模型服务模型类型独占实例资源规格后付费单价预付费单价
悦动人像EMO-detect预置模型轻量版¥20/实例/小时¥10,000/月
悦动人像EMO预置模型轻量版¥20/实例/小时¥10,000/月
舞动人像AnimateAnyone-detect预置模型轻量版¥20/实例/小时¥10,000/月
舞动人像AnimateAnyone预置模型轻量版¥20/实例/小时¥10,000/月

2.2 图像和视频生成模型(预置模型)

计费方式计费公式
按实例资源占用时长计费费用 = 资源占用时长(小时)× 实例数量 × 实例单价(不满1小时按1小时计费)
部署前可以在模型部署控制台查看不同模型的预估每小时费用。
实例包月计费/预付费费用 = 购买时长(月)× 实例数量 × 模型对应的实例单价
购买资源:请前往模型部署控制台(单击右上角的资源池管理)购买。(资源购买完成后便开始计费)
退订资源:请前往主账号的退订管理退订。退订后,将根据未用时长退回未使用金额。(不满1天按1天计费)

2.3 图片生成

模型服务模型类型独占实例资源规格后付费单价预付费单价
万相-文本生成图像-0521预置模型轻量版¥20/实例/小时¥10,000/月

2.4 视频生成

模型服务模型类型独占实例资源规格后付费单价预付费单价
悦动人像EMO-detect预置模型轻量版¥20/实例/小时¥10,000/月
悦动人像EMO预置模型轻量版¥20/实例/小时¥10,000/月
舞动人像AnimateAnyone-detect预置模型轻量版¥20/实例/小时¥10,000/月
舞动人像AnimateAnyone预置模型轻量版¥20/实例/小时¥10,000/月

三、常见问题

Q:模型部署什么时候开始计费?

A:当模型完成部署,即状态为运行中时,开始收取模型部署的费用。模型状态为部署中、欠费、部署失败时,均不会计费。

如果是包月预付费,模型状态为运行中后,开始消耗包月时间。

Q:取消模型训练会收费么?

A:会收费。如果您主动取消训练,之前已产生的费用仍会被计算。其他原因导致的训练中断,阿里云百炼不会向您收取训练费用。

Q:怎么查看已部署模型的调用统计?

A:请访问模型监控(北京)、模型监控(弗吉尼亚)、模型监控(新加坡)页面。

2026年阿里云AI产品与云产品优惠权益参考:
AI 产品权益主要包括阿里云百炼 Token Plan,提供多档位套餐,包月预算可控;Qwen3.6全模型通享 4.5 折;阿里云百炼优惠券,先用后返,最高200元,个企同享;阿里云 JVS Claw 39元起,一键接入 OpenClaw等。而云产品权益主要有轻量应用服务器限时抢购2核2G38元/年、2核4G9.9元1个月、199元/年;通用算力型u2i实例3折,九代c9i、g9i、r9i等实例1年付6.4折起等优惠权益。详情可通过阿里云权益中心了解:https://www.aliyun.com/benefit

购买之前建议先了解一下当下是否有优惠券或者代金券可以领取,2026年,阿里云官方已经通过云小站平台:👉https://www.aliyun.com/minisite/goods 推出云产品通用7.5折优惠券,先领券再购买,价格可以在优惠价格基础上额外获得一个7.5折优惠,最高能减12500元。

以上就是阿里云百炼平台的模型训练、模型部署的计费规则及价格介绍。

本文原创链接:https://www.tengxunyun8.com/19158.html
版权所有,如未注明,均为原创,转载请注明