典型场景
下面的示例展示了这类负载的常见调用方式,可作为起步参考。
框架环境
# 安装额外依赖
RUN pip install wandb tensorboard推荐模型
qwen3.5-35b-a3b qwen3.5-35b-a3b
高质量旗舰模型
偏强推理与复杂任务,适合复杂问答、长文分析、研究总结与需要更稳输出的应用。
九焱
Qwen3.5 122B qwen3.5-122b
更重质量的大参数通用模型。
适合高质量写作、复杂分析、研究总结、长文本问答和需要更稳输出的应用。
九焱
step-3.5-flash step-3.5-flash
轻量高速模型
主打低延迟、高并发与低成本,适合大规模在线调用、实时交互与批量处理。
九焱
Qwen3.5 Plus qwen3.5-plus
质量和成本更均衡的通用模型。
适合日常对话、轻量内容生成、业务助手、基础问答和较高并发的 API 调用。
九焱