模型 & 价格
下表所列模型价格以“百万 tokens”为单位。Token 是模型用来表示自然语言文本的的最小单位,可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。
模型 & 价格细节
- CNY
- USD
模型(1) | 上下文长度 | 最大输出长度(2) | 输入价格 (缓存命中)(3) | 输入价格 (缓存未命中) | 输出价格 |
---|---|---|---|---|---|
deepseek-chat | 128K | 4K (8KBeta) | 0.1元/百万tokens | 1元/百万tokens | 2元/百万tokens |
模型(1) | 上下文长度 | 最大输出长度(2) | 输入价格 (缓存命中)(3) | 输入价格 (缓存未命中) | 输出价格 |
---|---|---|---|---|---|
deepseek-chat | 128K | 4K (8KBeta) | 0.014美元/百万tokens | 0.14美元/百万tokens | 0.28美元/百万tokens |
- DeepSeek V2 Chat 和 DeepSeek Coder V2 两个模型已经合并升级,升级后的新模型为 DeepSeek V2.5。新模型在通用能力、代码能力上,都显著超过了旧版本的两个模型。为向前兼容,API 用户通过
deepseek-coder
或deepseek-chat
均可以访问新的模型。 - 我们正在对 Chat Completion API 的 8K 最大输出长度进行 Beta 测试,您需要设置
base_url="https://api.deepseek.com/beta"
来开启此功能。如果未设置 Beta 的base_url
,或未设置max_tokens
,最大输出长度为 4K。 - 关于上下文缓存的细节,请参考这篇文章。
扣费规则
扣减费用 = token 消耗量 × 模型单价,对应的费用将直接从充值余额或赠送余额中进行扣减。 当充值余额与赠送余额同时存在时,优先扣减赠送余额。
产品价格可能发生变动,DeepSeek 保留修改价格的权利。请您依据实际用量按需充值 ,定期查看此页面以获知最新价格信息。