模型定价

所有支持模型的 Token 单价一览,价格以每 1M Token 计。

DeepSeek R1 0528

推理

DeepSeek R1 的 0528 升级版,在编程能力、逻辑推理与代码补全上显著增强,长链路思考稳定,适合复杂算法与工程级代码生成。

输入

¥4

/1M Token

输出

¥16

/1M Token

Kimi K2 Thinking

推理

月之暗面 K2 系列的思考型模型,拓展至智能体化与长周期推理,擅长多步任务规划、工具调用与深度分析。

输入

¥4

/1M Token

输出

¥16

/1M Token

QwQ 32B

推理

通义千问推理专用模型,32B 参数在数学、逻辑与代码推理任务上表现优异,兼顾推理深度与响应速度。

输入

¥2

/1M Token

输出

¥6

/1M Token

Qwen3 235B A22B Thinking 2507

推理

Qwen3 旗舰级 MoE 思考模型(总参 235B / 激活 22B),面向高难度推理场景,输出严谨、上下文理解强。

输入

¥2

/1M Token

输出

¥20

/1M Token

Qwen3 30B A3B Thinking 2507

推理

Qwen3 轻量 MoE 思考模型(激活 3B),以极低成本提供可靠推理能力,适合高并发推理与成本敏感场景。

输入

¥0.70

/1M Token

输出

¥2.80

/1M Token

Qwen3 Next 80B A3B Thinking

推理

Qwen3 Next 架构思考模型,80B 总参仅激活 3B,新一代稀疏架构带来更高推理效率与更强的长文本推理。

输入

¥1

/1M Token

输出

¥10

/1M Token

DeepSeek V3.2

对话

DeepSeek 通用对话主力模型,综合能力均衡、性价比极高,适合日常编程问答、代码解释与通用助手场景。

输入

¥2

/1M Token

输出

¥3

/1M Token

DeepSeek V4 Flash

对话

DeepSeek V4 的极速轻量版,低延迟、低成本,适合实时补全、批量处理与高频调用场景。

输入

¥1

/1M Token

输出

¥2

/1M Token

DeepSeek V4 Pro

对话

DeepSeek V4 旗舰版,面向高质量代码生成与复杂任务,理解深、输出精,适合专业开发与生产环境。

输入

¥12

/1M Token

输出

¥24

/1M Token

GLM 4.6

对话

智谱 GLM-4.6,中文理解与代码能力出色,工具调用稳定,适合中文场景下的编程与 Agent 应用。

输入

¥2

/1M Token

输出

¥8

/1M Token

GLM 4.7

对话

智谱 GLM-4.7,在 4.6 基础上优化指令遵循与代码质量,长上下文表现更稳。

输入

¥2

/1M Token

输出

¥8

/1M Token

GLM 5

对话

智谱新一代旗舰 GLM-5,综合能力大幅提升,复杂推理、代码与多轮对话表现全面领先。

输入

¥4

/1M Token

输出

¥18

/1M Token

GLM 5.1

对话

GLM-5.1 旗舰增强版,面向最高质量需求的编程与 Agent 场景,输出严谨、稳定性强。

输入

¥6

/1M Token

输出

¥24

/1M Token

Kimi K2

对话

月之暗面 K2 通用对话模型,超长上下文、强工具调用能力,擅长文档处理与复杂任务编排。

输入

¥4

/1M Token

输出

¥16

/1M Token

Kimi K2.5

对话

Kimi K2.5 升级版,推理与代码能力进一步提升,长文本理解与多步任务执行更可靠。

输入

¥4

/1M Token

输出

¥21

/1M Token

MiMo V2 Flash

对话

小米 MiMo V2 极速版,轻量高效、成本极低,适合实时交互与高并发轻量任务。

输入

¥0.70

/1M Token

输出

¥2.10

/1M Token

MiniMax M2.1

对话

MiniMax M2.1 通用模型,对话自然、综合能力均衡,适合多场景智能助手与编程辅助。

输入

¥2.10

/1M Token

输出

¥8.40

/1M Token

MiniMax M2.5

对话

MiniMax M2.5,在 M2.1 基础上提升推理与代码能力,长上下文表现更佳。

输入

¥2.10

/1M Token

输出

¥8.40

/1M Token

MiniMax M2.7

对话

MiniMax M2.7 增强版,指令遵循与代码生成质量进一步优化,稳定性更强。

输入

¥2.10

/1M Token

输出

¥8.40

/1M Token

Qwen2.5 32B Instruct

对话

通义千问 2.5 代 32B 指令模型,中英文能力均衡,适合通用对话与中等复杂度编程任务。

输入

¥2

/1M Token

输出

¥6

/1M Token

Qwen2.5 72B Instruct

对话

通义千问 2.5 代 72B 指令模型,理解力强、知识面广,适合高质量内容生成与复杂问答。

输入

¥4

/1M Token

输出

¥12

/1M Token

Qwen2.5 7B Instruct

对话

通义千问 2.5 代 7B 轻量模型,成本极低、响应迅速,适合简单任务与大规模批处理。

输入

¥0.50

/1M Token

输出

¥1

/1M Token

Qwen3 14B

对话

Qwen3 14B 模型,兼顾能力与成本,适合通用编程问答与中文场景的高性价比选择。

输入

¥1

/1M Token

输出

¥4

/1M Token

Qwen3 235B A22B

对话

Qwen3 旗舰 MoE 模型(总参 235B / 激活 22B),综合能力强大,适合高质量生成与复杂任务。

输入

¥2

/1M Token

输出

¥8

/1M Token

Qwen3 235B A22B Instruct 2507

对话

Qwen3 235B 指令优化版(2507),指令遵循与代码能力增强,输出更贴合需求。

输入

¥2

/1M Token

输出

¥8

/1M Token

Qwen3 30B A3B Instruct 2507

对话

Qwen3 30B MoE 指令模型(激活 3B),低成本高效率,适合高并发通用对话场景。

输入

¥0.70

/1M Token

输出

¥2.80

/1M Token

Qwen3 32B

对话

Qwen3 32B 稠密模型,能力全面、稳定可靠,适合通用编程与多轮对话。

输入

¥2

/1M Token

输出

¥8

/1M Token

Qwen3 Next 80B A3B Instruct

对话

Qwen3 Next 架构指令模型,80B 总参激活 3B,新一代稀疏架构兼顾性能与极致性价比。

输入

¥1

/1M Token

输出

¥4

/1M Token

Qwen3.5 397B A17B

对话

Qwen3.5 超大规模 MoE 模型(总参 397B / 激活 17B),新一代旗舰,综合能力与长文本处理全面跃升。

输入

¥1.20

/1M Token

输出

¥7.20

/1M Token

LongCat Flash Chat

对话

美团 LongCat Flash 对话模型,响应快、成本优,擅长中文对话与日常编程辅助。

输入

¥1

/1M Token

输出

¥5

/1M Token

Qwen3 Coder

专业

通义千问代码专用旗舰模型,针对代码生成、补全与仓库级理解深度优化,Agent 编程能力突出。

输入

¥6

/1M Token

输出

¥24

/1M Token

Qwen3 Coder Next

专业

Qwen3 Coder 新架构版本,编程能力强且更高效,适合大型项目的代码生成与重构。

输入

¥4

/1M Token

输出

¥16

/1M Token

Seed-OSS 36B Instruct

其他

字节跳动 Seed 开源 36B 指令模型,长上下文与推理能力均衡,适合开源生态与定制化场景。

输入

¥1.20

/1M Token

输出

¥12

/1M Token