跳转到主内容

模型与价格

以百万 tokens 为单位计量计费。Token 是模型处理自然语言文本的最小语义单元。

模型细节deepseek-v4-flashdeepseek-v4-pro
BASE URL (OpenAI)https://api.deepseek.com
BASE URL (Anthropic)https://api.deepseek.com/anthropic
模型版本DeepSeek-V4-FlashDeepSeek-V4-Pro
思考模式支持非思考与思考模式(默认)
上下文长度1,000,000 tokens
输出长度最大 384,000 tokens
JSON Output✓ 支持✓ 支持
Tool Calls✓ 支持✓ 支持
前缀续写 (Beta)✓ 支持✓ 支持
FIM 补全 (Beta)✓ 仅非思考模式✓ 仅非思考模式
输入(缓存命中)¥0.02 / M¥0.025 / M
输入(缓存未命中)¥1.00 / M¥3.00 / M
输出¥2.00 / M¥6.00 / M
并发限制2,500500

* deepseek-chat / deepseek-reasoner 将于 2026/07/24 23:59 弃用。

扣费规则

计费方式

扣减费用 = token 消耗量 × 模型单价。充值余额与赠送余额同时存在时,优先扣减赠送余额。

Token 说明

模型处理文本的最小语义单元。1 个中文字符 ≈ 1.5-2 tokens。使用官方 Tokenizer 预估消耗。

缓存机制

重复上下文前缀自动缓存。多轮对话历史消息享受缓存价格,显著降低长对话成本。