模型定价

所有支持模型的 Token 单价一览，价格以每 1M Token 计。

DeepSeek R1 0528

推理

DeepSeek R1 的 0528 升级版，在编程能力、逻辑推理与代码补全上显著增强，长链路思考稳定，适合复杂算法与工程级代码生成。

输入

¥4

/1M Token

输出

¥16

/1M Token

Kimi K2 Thinking

推理

月之暗面 K2 系列的思考型模型，拓展至智能体化与长周期推理，擅长多步任务规划、工具调用与深度分析。

输入

¥4

/1M Token

输出

¥16

/1M Token

QwQ 32B

推理

通义千问推理专用模型，32B 参数在数学、逻辑与代码推理任务上表现优异，兼顾推理深度与响应速度。

输入

¥2

/1M Token

输出

¥6

/1M Token

Qwen3 235B A22B Thinking 2507

推理

Qwen3 旗舰级 MoE 思考模型（总参 235B / 激活 22B），面向高难度推理场景，输出严谨、上下文理解强。

输入

¥2

/1M Token

输出

¥20

/1M Token

Qwen3 30B A3B Thinking 2507

推理

Qwen3 轻量 MoE 思考模型（激活 3B），以极低成本提供可靠推理能力，适合高并发推理与成本敏感场景。

输入

¥0.70

/1M Token

输出

¥2.80

/1M Token

Qwen3 Next 80B A3B Thinking

推理

Qwen3 Next 架构思考模型，80B 总参仅激活 3B，新一代稀疏架构带来更高推理效率与更强的长文本推理。

输入

¥1

/1M Token

输出

¥10

/1M Token

DeepSeek V3.2

对话

DeepSeek 通用对话主力模型，综合能力均衡、性价比极高，适合日常编程问答、代码解释与通用助手场景。

输入

¥2

/1M Token

输出

¥3

/1M Token

DeepSeek V4 Flash

对话

DeepSeek V4 的极速轻量版，低延迟、低成本，适合实时补全、批量处理与高频调用场景。

输入

¥1

/1M Token

输出

¥2

/1M Token

DeepSeek V4 Pro

对话

DeepSeek V4 旗舰版，面向高质量代码生成与复杂任务，理解深、输出精，适合专业开发与生产环境。

输入

¥12

/1M Token

输出

¥24

/1M Token

GLM 4.6

对话

智谱 GLM-4.6，中文理解与代码能力出色，工具调用稳定，适合中文场景下的编程与 Agent 应用。

输入

¥2

/1M Token

输出

¥8

/1M Token

GLM 4.7

对话

智谱 GLM-4.7，在 4.6 基础上优化指令遵循与代码质量，长上下文表现更稳。

输入

¥2

/1M Token

输出

¥8

/1M Token

GLM 5

对话

智谱新一代旗舰 GLM-5，综合能力大幅提升，复杂推理、代码与多轮对话表现全面领先。

输入

¥4

/1M Token

输出

¥18

/1M Token

GLM 5.1

对话

GLM-5.1 旗舰增强版，面向最高质量需求的编程与 Agent 场景，输出严谨、稳定性强。

输入

¥6

/1M Token

输出

¥24

/1M Token

Kimi K2

对话

月之暗面 K2 通用对话模型，超长上下文、强工具调用能力，擅长文档处理与复杂任务编排。

输入

¥4

/1M Token

输出

¥16

/1M Token

Kimi K2.5

对话

Kimi K2.5 升级版，推理与代码能力进一步提升，长文本理解与多步任务执行更可靠。

输入

¥4

/1M Token

输出

¥21

/1M Token

MiMo V2 Flash

对话

小米 MiMo V2 极速版，轻量高效、成本极低，适合实时交互与高并发轻量任务。

输入

¥0.70

/1M Token

输出

¥2.10

/1M Token

MiniMax M2.1

对话

MiniMax M2.1 通用模型，对话自然、综合能力均衡，适合多场景智能助手与编程辅助。

输入

¥2.10

/1M Token

输出

¥8.40

/1M Token

MiniMax M2.5

对话

MiniMax M2.5，在 M2.1 基础上提升推理与代码能力，长上下文表现更佳。

输入

¥2.10

/1M Token

输出

¥8.40

/1M Token

MiniMax M2.7

对话

MiniMax M2.7 增强版，指令遵循与代码生成质量进一步优化，稳定性更强。

输入

¥2.10

/1M Token

输出

¥8.40

/1M Token

Qwen2.5 32B Instruct

对话

通义千问 2.5 代 32B 指令模型，中英文能力均衡，适合通用对话与中等复杂度编程任务。

输入

¥2

/1M Token

输出

¥6

/1M Token

Qwen2.5 72B Instruct

对话

通义千问 2.5 代 72B 指令模型，理解力强、知识面广，适合高质量内容生成与复杂问答。

输入

¥4

/1M Token

输出

¥12

/1M Token

Qwen2.5 7B Instruct

对话

通义千问 2.5 代 7B 轻量模型，成本极低、响应迅速，适合简单任务与大规模批处理。

输入

¥0.50

/1M Token

输出

¥1

/1M Token

Qwen3 14B

对话

Qwen3 14B 模型，兼顾能力与成本，适合通用编程问答与中文场景的高性价比选择。

输入

¥1

/1M Token

输出

¥4

/1M Token

Qwen3 235B A22B

对话

Qwen3 旗舰 MoE 模型（总参 235B / 激活 22B），综合能力强大，适合高质量生成与复杂任务。

输入

¥2

/1M Token

输出

¥8

/1M Token

Qwen3 235B A22B Instruct 2507

对话

Qwen3 235B 指令优化版（2507），指令遵循与代码能力增强，输出更贴合需求。

输入

¥2

/1M Token

输出

¥8

/1M Token

Qwen3 30B A3B Instruct 2507

对话

Qwen3 30B MoE 指令模型（激活 3B），低成本高效率，适合高并发通用对话场景。

输入

¥0.70

/1M Token

输出

¥2.80

/1M Token

Qwen3 32B

对话

Qwen3 32B 稠密模型，能力全面、稳定可靠，适合通用编程与多轮对话。

输入

¥2

/1M Token

输出

¥8

/1M Token

Qwen3 Next 80B A3B Instruct

对话

Qwen3 Next 架构指令模型，80B 总参激活 3B，新一代稀疏架构兼顾性能与极致性价比。

输入

¥1

/1M Token

输出

¥4

/1M Token

Qwen3.5 397B A17B

对话

Qwen3.5 超大规模 MoE 模型（总参 397B / 激活 17B），新一代旗舰，综合能力与长文本处理全面跃升。

输入

¥1.20

/1M Token

输出

¥7.20

/1M Token

LongCat Flash Chat

对话

美团 LongCat Flash 对话模型，响应快、成本优，擅长中文对话与日常编程辅助。

输入

¥1

/1M Token

输出

¥5

/1M Token

Qwen3 Coder

专业

通义千问代码专用旗舰模型，针对代码生成、补全与仓库级理解深度优化，Agent 编程能力突出。

输入

¥6

/1M Token

输出

¥24

/1M Token

Qwen3 Coder Next

专业

Qwen3 Coder 新架构版本，编程能力强且更高效，适合大型项目的代码生成与重构。

输入

¥4

/1M Token

输出

¥16

/1M Token

Seed-OSS 36B Instruct

其他

字节跳动 Seed 开源 36B 指令模型，长上下文与推理能力均衡，适合开源生态与定制化场景。

输入

¥1.20

/1M Token

输出

¥12

/1M Token