claude-api — API 开发助手
- 触发方式:
/claude-api或代码中导入anthropic/@anthropic-ai/sdk - 适用场景: 开发使用 Claude API 的应用、调试 API 调用、优化 prompt caching
- 不适用场景: 使用其他 LLM 提供商(OpenAI 等)、通用 API 开发
功能概述
claude-api 帮助你构建、调试和优化使用 Claude API / Anthropic SDK 的应用。它特别擅长处理 Prompt Caching、模型版本迁移和工具调用优化。
触发条件
以下情况会自动触发 claude-api:
- 代码中导入
anthropic或@anthropic-ai/sdk - 提到 Claude API、Anthropic SDK
- 添加/修改 Claude 功能(caching、thinking、tool use 等)
- 问关于 Prompt Caching 的问题
不会触发的情况:
- 导入
openai或其他 LLM 提供商 - 通用 HTTP API 开发
使用示例
示例 1:实现 Prompt Caching
/claude-api 帮我给这个对话应用添加 prompt caching,减少 token 消耗Claude 会分析代码并建议:
- 哪些内容适合缓存(系统提示、工具定义)
- 如何使用
cache_control标记 - 如何验证缓存命中率
示例 2:模型版本迁移
/claude-api 把这个项目从 Claude 4.5 迁移到 4.7,检查是否有 breaking changes示例 3:工具调用优化
/claude-api 我的 tool use 响应时间太长,帮我优化示例 4:错误处理
/claude-api 帮我完善 API 调用的错误处理和重试逻辑示例 5:Streaming 实现
/claude-api 给这个聊天应用添加 streaming 响应常见优化
| 优化点 | 效果 |
|---|---|
| Prompt Caching | 减少 90% 以上的重复 token 消耗 |
| Thinking Budget | 控制推理深度和成本 |
| Token 限制 | 避免超出模型上下文窗口 |
| 批量处理 | 减少 API 调用次数 |
注意事项
- Prompt Caching 的最小缓存长度有限制(通常 >1024 tokens)
- Caching 基于字符串完全匹配,即使一个空格不同也会 cache miss
- 模型版本迁移时注意行为差异,不只是 API 差异
- 在生产环境中务必实现指数退避重试
相关 Skills
- write-a-skill — 把常用的 API 调用模式封装为 Skill
- diagnose — API 调用异常排查