阿里云百炼,一站式大模型开发与应用平台,集成千问、DeepSeek、Kimi、GLM等主流模型,开箱即用。开发者友好——兼容OpenAI接口,改三个参数就能迁移现有项目,Python、Node.js、curl随心调用,北京、美国、新加坡、德国多地域就近接入。千问Max、Plus等旗舰模型无需部署运维,内容创作、摘要生成一调即得。业务人员同样能上手——可视化拖拽即可搭建智能体、知识库问答等AI应用,无需写一行代码。从API调用到应用落地,百炼让大模型真正用起来。

一、主要能力:
调用 API
几行代码即可调用大模型,实现内容创作、摘要生成等功能。
百炼兼容 OpenAI 接口规范,只需调整API Key、base_url 和模型名称,即可将现有 OpenAI 代码迁移至百炼。
1、Python
import os
from openai import OpenAI
注意: 不同地域的base_url不通用(下方示例使用北京地域的 base_url)
- 华北2(北京): https://dashscope.aliyuncs.com/compatible-mode/v1
- 美国(弗吉尼亚): https://dashscope-us.aliyuncs.com/compatible-mode/v1
- 新加坡: https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1,请将WorkspaceId替换为业务空间ID
- 德国(法兰克福): https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/compatible-mode/v1,请将WorkspaceId替换为业务空间ID
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
model="qwen3.7-plus",
messages=[{'role': 'user', 'content': '你是谁?'}]
)
print(completion.choices[0].message.content)
2、Node.js
import OpenAI from "openai";
// 注意: 不同地域的base_url不通用(下方示例使用北京地域的base_url)
// - 华北2(北京): https://dashscope.aliyuncs.com/compatible-mode/v1
// - 美国(弗吉尼亚): https://dashscope-us.aliyuncs.com/compatible-mode/v1
// - 新加坡: https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1,请将WorkspaceId替换为业务空间ID
// - 德国(法兰克福): https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/compatible-mode/v1,请将WorkspaceId替换为业务空间ID
const openai = new OpenAI(
{
apiKey: process.env.DASHSCOPE_API_KEY,
baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
}
);
async function main() {
const completion = await openai.chat.completions.create({
model: "qwen3.7-plus",
messages: [{ role: "user", content: "你是谁?"}],
});
console.log(completion.choices[0].message.content)
}
main()
3、curl
不同地域的 Base URL不通用(以下示例是北京地域 Base URL)
- 华北2(北京): https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
- 美国(弗吉尼亚): https://dashscope-us.aliyuncs.com/compatible-mode/v1/chat/completions
- 新加坡: https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1/chat/completions,请将WorkspaceId替换为业务空间ID
- 德国(法兰克福): https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/compatible-mode/v1/chat/completions,请将WorkspaceId替换为业务空间ID
curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
-H "Authorization: Bearer $DASHSCOPE_API_KEY"
-H "Content-Type: application/json"
-d '{
"model": "qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "你是谁?"
}
]
}'
二、模型服务
2.1 开箱即用的模型
百炼提供开箱即用的模型服务,无需自行部署或运维,直接调用自研千问(Qwen)全系列模型,以及 DeepSeek、Kimi、GLM 等第三方大模型。
- 千问(Qwen)系列旗舰模型:
- 千问 Max:Qwen 系列效果最好的模型,适合处理复杂、多步骤任务。最新的 qwen3.7-max 推理能力全面超越前代,推荐选用。
- 千问 Plus:效果、速度和成本均衡,是多数场景的推荐选择。
- 千问 Flash:高性价比、低延迟,适合需要快速响应的简单任务。
- 千问 Max:Qwen 系列效果最好的模型,适合处理复杂、多步骤任务。最新的 qwen3.7-max 推理能力全面超越前代,推荐选用。
- 多模态覆盖:涵盖文本生成、视觉理解、图像生成、视频生成、语音识别与合成、嵌入向量等多种能力。
- 细分领域模型:提供长文本处理、翻译、数据挖掘、法律、意图理解、角色扮演、深入研究等多种领域模型。
2.2 模型调优、部署和评测
- 模型调优:支持有监督微调(SFT)、继续预训练(CPT)和直接偏好优化(DPO),满足特定业务需求。
- 模型部署:将预置模型或调优后的自定义模型部署为资源专享的推理服务,满足高并发、低延迟等性能要求。支持按时长、包月、按 Token 量等多种计费方式。
- 模型评测:提供人工评测、自动评测和基线评测,支持快速对比不同模型表现,验证调优效果,提前发现潜在调用风险。
三、应用构建
- 应用类型:提供可视化和高代码两种开发模式。可视化模式可快速创建智能体应用和工作流应用;高代码应用则支持将 Python 项目部署为后端服务,具备自动化运维、可观测、日志服务等能力。
- 功能拓展:通过知识库(RAG)接入私有数据和专业领域知识;通过插件和模型上下文协议(MCP)调用外部服务。
- 分享与发布:支持将应用发布至网页、钉钉机器人、微信公众号及音视频互动智能体等多种平台。
四、产品计费
开通百炼无需费用,调用、微调、部署模型时产生相应费用。百炼部分模型实行阶梯计费。单价取决于单次请求的输入 Token 总量。该请求的所有 Token 均按对应阶梯的单价结算。
例如,某模型设有两档计费区间:0 < Token ≤ 32K 和 32K < Token ≤ 128K。若输入 100K Token,因数值落在第二区间(32K < 100K ≤ 128K),所有 Token 均按第二档单价结算。模型调用计费详情可参考:https://help.aliyun.com/zh/model-studio/model-pricing
五、新用户免费额度
百炼为新用户提供北京地域专属的新人免费额度,用于体验模型调用。当您首次开通阿里云百炼时,平台会自动为您发放各模型的新人专属免费额度。
说明:仅华北2(北京)地域且服务部署范围为中国内地的模型享有免费额度,其他地域和部署范围无免费额度。
5.1 规则说明
有效期
免费额度的有效期为 30~90 天,从开通阿里云百炼或模型申请通过之日起计算。额度到期或耗尽后,继续调用模型推理服务将产生计费。
首次开通阿里云百炼的用户,获赠的新人免费额度有效期调整为 90 天,用户可通过阿里云百炼大模型服务平台:https://www.aliyun.com/product/bailian 申请免费额度。系统将自动开通阿里云百炼并发放免费推理额度。

如果未弹出服务协议,表示您已经开通过阿里云百炼且获得免费额度。
适用范围
免费额度仅抵扣模型实时推理(调用)产生的费用,不支持抵扣以下场景:
- Batch调用
- 模型调优
- 模型部署
- 自定义模型(调优后模型、已部署模型)
注意事项
阿里云主账号与其RAM子账号共享免费额度。
例如:qwen-max的总免费额度为100万Token。主账号消耗了10万Token,RAM子账号消耗了20万Token,qwen-max的剩余免费额度为70万Token。
5.2 查看剩余额度
可通过以下两种方式查看模型的免费额度。
方式一:通过模型用量查看
在控制台的模型用量页面,点击免费额度页签,查看所有模型的免费额度余量及过期时间。
方式二:通过模型广场查看
1.在控制台的模型广场页面,找到目标模型系列并单击进入详情页。

2.在模型Code选择模型版本,在免费额度区域查看余量。若无免费额度显示,可能额度已到期,具体有效期参见模型列表。362,917/1,000,000 表示剩余 362,917 个Token,总共 1,000,000 个Token。控制台显示的免费额度为分钟级更新(需手动刷新页面)。

5.3 使用免费额度
实时调用大模型将自动扣除免费额度,
默认情况下,全新未认证用户免费额度耗尽后无法继续使用,需要认证并充值后方能继续按量付费。已认证用户免费额度耗尽后继续调用会直接扣费,可提前开启免费额度用完即停功能,防止产生意外费用。
全新未认证用户免费额度耗尽后,将停止响应并返回错误码 AllocationQuota.FreeTierOnly,需要认证并充值后方能继续按量付费。
免费额度用完即停
开启此功能后,免费额度耗尽时将停止响应并返回错误码 AllocationQuota.FreeTierOnly,不会继续扣费。
如何开启
方式一:在模型用量页面开启
为单个模型开启:
- 在控制台的模型用量页面,点击免费额度页签。
- 在列表中找到目标模型,在其右侧操作列开启免费额度用完即停开关(无免费额度的模型无法开启)。
批量开启:
- 在控制台的模型用量页面,点击免费额度页签。
- 点击批量操作免费额度用完即停,在下拉菜单中选择批量开启。
- 勾选目标模型,点击批量开启。如需为所有支持且未开启的模型启用,可点击一键开启所有模型。
- 在确认弹窗中点击开启免费额度用完即停。
方式二:在模型广场页面开启
以 Qwen3-Coder-Plus 为例。前往Qwen3-Coder-Plus 模型详情页,开启免费额度用完即停开关。
若模型未显示开关,说明该模型免费额度已耗尽或过期,或模型本身不提供免费额度。
如何关闭
该功能默认关闭。若已启用免费额度用完即停,需等到控制台显示免费额度用完后才可关闭。
控制台显示的免费额度为分钟级更新(需手动刷新页面)。
六、阿里云百炼大模型服务优惠
阿里云AI通用型节省计划是针对大模型按量付费使用场景设计的折扣方案。只需承诺在一定期限内(3 个月、6 个月、12 个月或 24 个月)的月消费金额,即可在保留按量付费灵活性的基础上,享受阶梯式折扣,优化模型调用成本。从档位上来区分可分为A类、B类和C类。更多阿里云大模型服务平台百炼节省计划与资源包官方介绍可参考:https://help.aliyun.com/zh/model-studio/savings-plan-and-resource-package

承诺周期说明:以月为单位(从生效日到下个月的对应日),月承诺周期结束时,剩余额度自动过期,不可累积到下一周期。举例:如果一次性订阅了 3 个月的节省计划(月承诺额度 1000 元),并非在 3 个月内获得 3000 元总额度,而是每月独立获得 1000 元额度,当月未使用完的部分自动清零,不可累积到下个订阅月。
抵扣范围:
- 支持抵扣:模型调用(输入和输出 Tokens)、模型原生工具调用(如 Function Call、联网搜索、网页抓取等)、上下文缓存、批量推理等产生的费用。
- 不支持抵扣:模型调优、模型部署的费用,以及 MCP 广场和模型体验的联网搜索的费用。
抵扣逻辑:
- 抵扣顺序:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。
- 多个同类型的节省计划:优先抵扣先到期的节省计划。若到期时间相同,则优先抵扣先购买的节省计划。
- 超出部分处理:如果同类节省计划全部到期或额度全部抵扣完后,仍有超出部分,自动转为按量付费。
此外,阿里云还推出了入门型AI通用节省计划,面向新用户提供三档全模型通用抵扣券:全模型通用抵扣20元(新客当月抵扣,直省50%,价格10元/1个月)、全模型通用抵扣100元(新客当月抵扣,直省50%,价格50元/1个月)、全模型通用抵扣500元(新客当月抵扣,直省50%,价格250元/1个月)。详情可通过智启AI普惠权益:https://www.aliyun.com/benefit/ai/discount 等相关活动查阅。

七、开始使用阿里云百炼
- 在线体验大模型:
- 打开阿里云百炼控制台,在右上角选择目标地域
- 进入模型体验页面,选择模型开始体验
- 发起第一个API请求:首次调用千问API
- 构建第一个大模型应用:0代码构建问答应用
八、常见问题
Q:我的数据安全吗?阿里云百炼会用我的数据进行训练吗?
A:不会。阿里云严格保护数据隐私,不会将您的数据用于模型训练。构建应用或训练模型时传输的所有数据均经过加密处理。
Q:阿里云百炼提供哪些地域的服务?不同地域有什么区别?
A:目前提供以下地域的模型服务:
华北2(北京)、美国(弗吉尼亚、国际(新加坡)和德国(法兰克福)地域
建议选择邻近地域以降低网络延迟。各地域的接入点(Endpoint/Base URL)不同,API Key 不通用,支持的模型、平台功能与价格也有所差异。
Q:如何避免产生费用?
A:百炼采用按量付费,本身没有"自动扣费"开关。以下措施可有效控制费用:
- 删除API Key:前往阿里云百炼控制台,选择目标地域,进入API-KEY页面,删除所有API Key,从源头阻断调用。
- 停止所有调用:停止应用程序、智能体、工作流中的模型调用,并排查定时任务和后台进程。
- 清理计费资源:删除不再使用的知识库;前往模型部署页面,下线按算力时长计费的部署实例。
- 开启"免费额度用完即停"(仅限新用户且在免费额度有效期内):在模型详情页开启此开关,免费额度耗尽后服务自动停止,不会转为付费。仅适用于华北2(北京)地域(中国内地服务部署范围),且须在免费额度有效期内。
- 设置费用监控和预警:查看 账单详情和模型监控,并设置高额消费预警,及时发现异常消费。
- 订阅 Coding Plan(AI 编码套餐):固定月费,提供月度请求额度,无按量扣费风险。注意需使用 Coding Plan 专属的 Base URL和API Key 进行调用,否则模型调用将按量付费。
Q:如何使用 Qwen3 系列模型或 DeepSeek?
A:
- 在线体验:打开阿里云百炼控制台,选择目标地域,进入模型广场页面,点击模型即可体验(DeepSeek 仅支持北京地域)。
- 通过API调用:请参见首次调用千问API。
- 通过开发工具(如 Claude Code)调用:
- 通过可视化界面构建大模型应用:
Q:免费额度即将用完或已用完,是否有通知?
A:有通知。余量降至 20% 或完全耗尽时,系统通过短信、站内信、邮件发送通知。
如需开启或关闭预警、修改预警比例,请前往我的试用进行设置。找到试用规格描述为百炼大模型推理免费试用,单击查看试用详情,再单击右上角配置余量到期预警规则即可修改。
Q:免费额度用完会有什么影响?
A:对于全新未认证用户:免费额度用完后无法继续调用。需要完成认证后方可继续按量付费。
对于已认证用户:
- 若已开启免费额度用完即停,免费额度用完后无法继续调用,需要关闭免费额度用完即停方可继续按量付费。
- 若未开启免费额度用完即停,正在进行的调用不会中断,超出额度的Token将按控制台中的输入/输出价格计费,费用以按量后付费方式从阿里云账户扣除,可能导致账户欠费。
账户欠费时,即使其他模型仍有免费额度也无法调用。
调用前建议查询该模型剩余额度,并配置预算管理或账号余额预警,确保账户有充足余额,未使用的余额支持余额提现。
Q:如何查看免费额度消耗记录或账单?
A:调用结束几分钟后即可生成消耗记录。查询步骤:
- 在账单详情页面,选择账单月份,产品名称选择大模型服务平台百炼,单击搜索。
- 单击账单列表右上角的查看图标,找到用量信息,勾选抵扣用量,单击确定。
- 找到费用类型为免费额度的账单项,抵扣用量即为免费额度已抵扣的用量。
Q:为什么产生了费用?
A:常见原因:
- 使用的模型已经没有免费额度。
- 免费额度不支持抵扣OpenAI兼容-Batch(文件输入)产生的费用。
- 控制台的免费额度数据为分钟级更新且需手动刷新。若未及时刷新,页面显示仍有额度但实际已耗尽,导致产生调用费用。操作前刷新页面,以最新显示为准。
Q:如何查看产生费用的模型?
A:调用结束几分钟后,在账单详情页面,选择账单月份,商品名称选择阿里云百炼大模型推理,单击搜索。在资产/资源实例ID 列查看产生费用的模型。
Q:如何查看模型调用记录?
A:模型调用完一小时后,在模型监控北京或新加坡页面设置查询条件(例如,选择时间范围、业务空间等),再在模型列表区域找到目标模型并单击操作列的监控,即可查看该模型的调用统计结果。
数据按小时更新,高峰期可能有小时级延迟,请您耐心等待。

Q:如何避免扣费?
A:超出免费额度后会自动从账号余额扣费。可通过以下方式降低扣费风险:
- 删除已创建的 API-Key:进入阿里云百炼的API-Key(北京)或者(新加坡)页面,删除已创建的 API-Key。删除后将无法通过API调用模型,不再产生调用费用。
- 设置高额消费预警:当产品日账单超过预警阈值时,每天短信提醒一次(统计截止昨日24点)。
在预警产品下拉框中选择具体产品(如百炼大模型部署、百炼大模型推理、百炼大模型训练),在预警阈值输入框中填写金额(如0.01),然后单击增加即可添加预警规则。
Q:还有剩余额度,为何调用失败?
A:请检查阿里云账户是否欠费。账户欠费时,即使模型仍有免费额度也无法调用。
A:Q:为什么看不到免费额度与有效期?
免费额度列显示无免费额度或免费额度区域不显示,说明该账号下对应模型的免费额度已到期。
北京地域没有免费额度。
购买之前建议先了解一下当下是否有优惠券或者代金券可以领取,2026年,阿里云官方已经通过云小站平台:👉https://www.aliyun.com/minisite/goods 推出云产品通用折扣优惠券,先领券再购买,价格可以在优惠价格基础上额外获得一个折扣优惠,最高能减12500元。

小结:阿里云百炼作为一站式大模型开发与应用平台,凭借兼容OpenAI的API规范、覆盖千问及DeepSeek等150+主流模型的能力,以及灵活的计费机制,极大降低了开发者接入大模型的门槛。无论是通过几行代码快速调用API,还是利用可视化工具零代码构建智能体应用,百炼都能满足不同角色的需求。平台提供的免费额度、按量付费、节省计划及Token订阅等多种计费方式,让用户可以根据自身业务规模灵活控制成本。加上数据不用于模型训练的隐私保障,以及完善的账单监控与预警机制,阿里云百炼为企业和开发者提供了一个安全、高效、可控的AI落地路径,是当前大模型应用开发的优质选择。