模型定价
所有支持模型的 Token 单价一览,价格以每 1M Token 计。
DeepSeek R1 0528
推理DeepSeek R1 的 0528 升级版,在编程能力、逻辑推理与代码补全上显著增强,长链路思考稳定,适合复杂算法与工程级代码生成。
输入
¥4
/1M Token
输出
¥16
/1M Token
Kimi K2 Thinking
推理月之暗面 K2 系列的思考型模型,拓展至智能体化与长周期推理,擅长多步任务规划、工具调用与深度分析。
输入
¥4
/1M Token
输出
¥16
/1M Token
QwQ 32B
推理通义千问推理专用模型,32B 参数在数学、逻辑与代码推理任务上表现优异,兼顾推理深度与响应速度。
输入
¥2
/1M Token
输出
¥6
/1M Token
Qwen3 235B A22B Thinking 2507
推理Qwen3 旗舰级 MoE 思考模型(总参 235B / 激活 22B),面向高难度推理场景,输出严谨、上下文理解强。
输入
¥2
/1M Token
输出
¥20
/1M Token
Qwen3 30B A3B Thinking 2507
推理Qwen3 轻量 MoE 思考模型(激活 3B),以极低成本提供可靠推理能力,适合高并发推理与成本敏感场景。
输入
¥0.70
/1M Token
输出
¥2.80
/1M Token
Qwen3 Next 80B A3B Thinking
推理Qwen3 Next 架构思考模型,80B 总参仅激活 3B,新一代稀疏架构带来更高推理效率与更强的长文本推理。
输入
¥1
/1M Token
输出
¥10
/1M Token
DeepSeek V3.2
对话DeepSeek 通用对话主力模型,综合能力均衡、性价比极高,适合日常编程问答、代码解释与通用助手场景。
输入
¥2
/1M Token
输出
¥3
/1M Token
DeepSeek V4 Flash
对话DeepSeek V4 的极速轻量版,低延迟、低成本,适合实时补全、批量处理与高频调用场景。
输入
¥1
/1M Token
输出
¥2
/1M Token
DeepSeek V4 Pro
对话DeepSeek V4 旗舰版,面向高质量代码生成与复杂任务,理解深、输出精,适合专业开发与生产环境。
输入
¥12
/1M Token
输出
¥24
/1M Token
GLM 4.6
对话智谱 GLM-4.6,中文理解与代码能力出色,工具调用稳定,适合中文场景下的编程与 Agent 应用。
输入
¥2
/1M Token
输出
¥8
/1M Token
GLM 4.7
对话智谱 GLM-4.7,在 4.6 基础上优化指令遵循与代码质量,长上下文表现更稳。
输入
¥2
/1M Token
输出
¥8
/1M Token
GLM 5
对话智谱新一代旗舰 GLM-5,综合能力大幅提升,复杂推理、代码与多轮对话表现全面领先。
输入
¥4
/1M Token
输出
¥18
/1M Token
GLM 5.1
对话GLM-5.1 旗舰增强版,面向最高质量需求的编程与 Agent 场景,输出严谨、稳定性强。
输入
¥6
/1M Token
输出
¥24
/1M Token
Kimi K2
对话月之暗面 K2 通用对话模型,超长上下文、强工具调用能力,擅长文档处理与复杂任务编排。
输入
¥4
/1M Token
输出
¥16
/1M Token
Kimi K2.5
对话Kimi K2.5 升级版,推理与代码能力进一步提升,长文本理解与多步任务执行更可靠。
输入
¥4
/1M Token
输出
¥21
/1M Token
MiMo V2 Flash
对话小米 MiMo V2 极速版,轻量高效、成本极低,适合实时交互与高并发轻量任务。
输入
¥0.70
/1M Token
输出
¥2.10
/1M Token
MiniMax M2.1
对话MiniMax M2.1 通用模型,对话自然、综合能力均衡,适合多场景智能助手与编程辅助。
输入
¥2.10
/1M Token
输出
¥8.40
/1M Token
MiniMax M2.5
对话MiniMax M2.5,在 M2.1 基础上提升推理与代码能力,长上下文表现更佳。
输入
¥2.10
/1M Token
输出
¥8.40
/1M Token
MiniMax M2.7
对话MiniMax M2.7 增强版,指令遵循与代码生成质量进一步优化,稳定性更强。
输入
¥2.10
/1M Token
输出
¥8.40
/1M Token
Qwen2.5 32B Instruct
对话通义千问 2.5 代 32B 指令模型,中英文能力均衡,适合通用对话与中等复杂度编程任务。
输入
¥2
/1M Token
输出
¥6
/1M Token
Qwen2.5 72B Instruct
对话通义千问 2.5 代 72B 指令模型,理解力强、知识面广,适合高质量内容生成与复杂问答。
输入
¥4
/1M Token
输出
¥12
/1M Token
Qwen2.5 7B Instruct
对话通义千问 2.5 代 7B 轻量模型,成本极低、响应迅速,适合简单任务与大规模批处理。
输入
¥0.50
/1M Token
输出
¥1
/1M Token
Qwen3 14B
对话Qwen3 14B 模型,兼顾能力与成本,适合通用编程问答与中文场景的高性价比选择。
输入
¥1
/1M Token
输出
¥4
/1M Token
Qwen3 235B A22B
对话Qwen3 旗舰 MoE 模型(总参 235B / 激活 22B),综合能力强大,适合高质量生成与复杂任务。
输入
¥2
/1M Token
输出
¥8
/1M Token
Qwen3 235B A22B Instruct 2507
对话Qwen3 235B 指令优化版(2507),指令遵循与代码能力增强,输出更贴合需求。
输入
¥2
/1M Token
输出
¥8
/1M Token
Qwen3 30B A3B Instruct 2507
对话Qwen3 30B MoE 指令模型(激活 3B),低成本高效率,适合高并发通用对话场景。
输入
¥0.70
/1M Token
输出
¥2.80
/1M Token
Qwen3 32B
对话Qwen3 32B 稠密模型,能力全面、稳定可靠,适合通用编程与多轮对话。
输入
¥2
/1M Token
输出
¥8
/1M Token
Qwen3 Next 80B A3B Instruct
对话Qwen3 Next 架构指令模型,80B 总参激活 3B,新一代稀疏架构兼顾性能与极致性价比。
输入
¥1
/1M Token
输出
¥4
/1M Token
Qwen3.5 397B A17B
对话Qwen3.5 超大规模 MoE 模型(总参 397B / 激活 17B),新一代旗舰,综合能力与长文本处理全面跃升。
输入
¥1.20
/1M Token
输出
¥7.20
/1M Token
LongCat Flash Chat
对话美团 LongCat Flash 对话模型,响应快、成本优,擅长中文对话与日常编程辅助。
输入
¥1
/1M Token
输出
¥5
/1M Token
Qwen3 Coder
专业通义千问代码专用旗舰模型,针对代码生成、补全与仓库级理解深度优化,Agent 编程能力突出。
输入
¥6
/1M Token
输出
¥24
/1M Token
Qwen3 Coder Next
专业Qwen3 Coder 新架构版本,编程能力强且更高效,适合大型项目的代码生成与重构。
输入
¥4
/1M Token
输出
¥16
/1M Token
Seed-OSS 36B Instruct
其他字节跳动 Seed 开源 36B 指令模型,长上下文与推理能力均衡,适合开源生态与定制化场景。
输入
¥1.20
/1M Token
输出
¥12
/1M Token