GPU 算力与大模型 API，一处接入

按小时租用 NVIDIA GPU，或用一套兼容主流 SDK 的密钥调用全部在线模型。一份余额贯穿算力与模型，按量计费。

立即开始查看文档

console.ninefireai.cn/instances

ninefireai.cn

算力实例

3 个运行中，1 个已关机

搜索实例

新建实例

运行实例

已关机

机型

实例	机型	状态
train-01	RTX 4090 24G	运行中
infer-02	A100 40G	运行中
batch-07	H100 80G	运行中
dev-12	Tesla T4 3G	已关机

quickstart.py

from openai import OpenAI

client = OpenAI(base_url="https://ninefireai.cn/api/v1", api_key="sk-xxxxxx")
resp = client.chat.completions.create(
    model="MiniMax-M2.5",
    messages=[{"role": "user", "content": "请简要介绍你的能力"}],
)

在售 GPU 机型

在线模型

模型供应商

当前空闲卡

GPU 算力价目

从切分卡到整机独享，按小时计费，实时库存可见，关机即停止扣费。

查看全部机型

机型	显存	空闲	每小时
Tesla T4 3G 切分 Tesla T4	3GB	0 / 0	¥0.12 / 时
Tesla T4 1G 切分 Tesla T4	1GB	0 / 0	¥0.24 / 时
Tesla T4 8G 切分 Tesla T4	8GB	0 / 0	¥0.60 / 时
Tesla T4 16G 独享 Tesla T4	16GB	0 / 0	¥1.20 / 时
RTX3090 24G 独享 RTX3090	24GB	0 / 0	¥1.20 / 时

大模型 API 价目

价格以每百万 token 计，输入与输出分别标注。同一密钥可调用全部模型。

查看全部模型

模型	类型	输入 / 百万	输出 / 百万
qwen3.5-35b-a3b qwen3.5-35b-a3b	文本	¥0.40	¥3.20
qwen3.5-122b qwen3.5-122b	文本	¥0.64	¥5.12
step-3.5-flash step-3.5-flash	文本	¥0.70	¥2.10
qwen3.5-plus qwen3.5-plus	文本	¥0.80	¥4.80
deepseek-v4-flash deepseek-v4-flash	文本	¥1.00	¥2.00
deepseek-v4-flash-158b deepseek-v4-flash-158b	文本	¥1.00	¥2.00

几分钟即可接入，按量付费

注册即得测试额度，开通后分配独立密钥与算力实例。先试用，再决定规模。

立即开始查看文档