deepseek api费用核验需分五步:一查响应头x-billed-tokens或usage字段获取精确token数;二查控制台确认模型实时输入/输出单价;三按双单价分别计算输入输出费用后相加;四核对控制台用量页小时级明细;五调用/v1/usage接口批量拉取结构化数据校验。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您调用 DeepSeek API 后发现费用与预期不符,或需核对某次请求的实际计费依据,则问题很可能源于对 token 消耗量与单价匹配关系的理解偏差。以下是验证与计算 DeepSeek API 费用的具体操作路径:
一、确认单次请求的 token 消耗量
每次 API 调用返回的响应头与响应体中均包含精确的 token 计数字段,该数值为计费唯一依据,不依赖客户端估算。
1、检查 HTTP 响应头中的 x-billed-tokens 字段,其值为本次请求计入账单的总 token 数(输入 + 输出)。
2、解析响应体 JSON 中的 usage 对象,提取 prompt_tokens 与 completion_tokens 两个整型数值。
3、若使用官方 Python SDK,可通过 response.usage.total_tokens 直接获取总 token 数,避免手动加总误差。
二、查证当前所用模型的实时单价
DeepSeek 不同模型版本对应不同单价,且单价可能随时间调整;必须以控制台展示的最新标价为准,不可沿用历史文档数值。
1、访问 https://platform.deepseek.com 并使用主账号登录。
2、点击顶部导航栏“控制台”,进入管理界面。
3、在左侧菜单中选择“模型”或“Pricing”标签页。
4、定位目标模型(如 DeepSeek-V3、DeepSeek-R1 或 DeepSeek-Coder-V2),查看其当前标注的 输入单价(元/千 token) 与 输出单价(元/千 token)。
三、执行费用计算(双单价模式)
DeepSeek 自 2025 年起对多数主流模型采用输入/输出分离计价,需分别乘以对应单价后求和,不可统一按总 token 数乘单一单价。
1、将 prompt_tokens 除以 1,000,000,再乘以模型页面显示的 输入单价(元/百万 token),得出输入部分费用。
2、将 completion_tokens 除以 1,000,000,再乘以模型页面显示的 输出单价(元/百万 token),得出输出部分费用。
3、将两部分费用相加,即为该次请求的最终扣费金额,保留小数点后六位用于对账。
四、核对周期内累计用量与账单明细
控制台提供的用量汇总数据按自然月归集,支持下钻至小时级原始记录,是验证费用合理性的权威来源。
1、在控制台左侧菜单中选择“用量”或“Usage”标签页。
2、确认页面顶部显示的计费周期(如“2026年2月1日–2026年2月15日”)与待核查时段一致。
3、在表格中找到对应模型行,读取“已用输入 Token 数”、“已用输出 Token 数”及系统自动计算的“费用估算值”。
4、点击该行右侧“详情”按钮,展开当日每小时粒度的 Token 分布图,并核对具体请求 ID 的 x-billed-tokens 值是否与响应头一致。
五、通过 API 接口批量拉取结构化用量数据
当需将用量信息同步至内部财务系统或生成自动化报表时,调用用量查询接口可获取毫秒级精度的原始记录,不含任何估算成分。
1、向 https://api.deepseek.com/v1/usage 发起 GET 请求,携带有效 Bearer Token 认证头。
2、在请求参数中指定 start_date 与 end_date(格式为 YYYY-MM-DD),限定查询范围。
3、响应 JSON 中的 data 数组每项包含 request_id、model、prompt_tokens、completion_tokens 及 timestamp 字段。
4、本地按模型分组,分别累加 prompt_tokens 与 completion_tokens,代入对应单价完成批量计费校验。











