跳到主内容

GPU 算力大模型 API一处接入

按小时租用 NVIDIA GPU,或用一套兼容主流 SDK 的密钥调用全部在线模型。一份余额贯穿算力与模型,按量计费。

算力实例

3 个运行中,1 个已关机

新建实例
运行实例
3
已关机
1
机型
4
实例状态
train-01 运行中
infer-02 运行中
batch-07 运行中
dev-12 已关机
在售 GPU 机型
5
在线模型
21
模型供应商
6
当前空闲卡
21

GPU 算力价目

从切分卡到整机独享,按小时计费,实时库存可见,关机即停止扣费。

查看全部机型
机型显存空闲每小时
Tesla T4 3G 切分
Tesla T4
3GB0 / 0¥0.12 / 时
Tesla T4 1G 切分
Tesla T4
1GB0 / 0¥0.24 / 时
Tesla T4 8G 切分
Tesla T4
8GB0 / 0¥0.60 / 时
Tesla T4 16G 独享
Tesla T4
16GB0 / 0¥1.20 / 时
RTX3090 24G 独享
RTX3090
24GB0 / 0¥1.20 / 时

大模型 API 价目

价格以每百万 token 计,输入与输出分别标注。同一密钥可调用全部模型。

查看全部模型
模型类型输入 / 百万输出 / 百万
qwen3.5-35b-a3b
qwen3.5-35b-a3b
文本¥0.40¥3.20
qwen3.5-122b
qwen3.5-122b
文本¥0.64¥5.12
step-3.5-flash
step-3.5-flash
文本¥0.70¥2.10
qwen3.5-plus
qwen3.5-plus
文本¥0.80¥4.80
deepseek-v4-flash
deepseek-v4-flash
文本¥1.00¥2.00
deepseek-v4-flash-158b
deepseek-v4-flash-158b
文本¥1.00¥2.00

几分钟即可接入,按量付费

注册即得测试额度,开通后分配独立密钥与算力实例。先试用,再决定规模。