claude-api — API 开发助手

触发方式: /claude-api 或代码中导入 anthropic/@anthropic-ai/sdk
适用场景: 开发使用 Claude API 的应用、调试 API 调用、优化 prompt caching
不适用场景: 使用其他 LLM 提供商（OpenAI 等）、通用 API 开发

功能概述

claude-api 帮助你构建、调试和优化使用 Claude API / Anthropic SDK 的应用。它特别擅长处理 Prompt Caching、模型版本迁移和工具调用优化。

触发条件

以下情况会自动触发 claude-api：

代码中导入 anthropic 或 @anthropic-ai/sdk
提到 Claude API、Anthropic SDK
添加/修改 Claude 功能（caching、thinking、tool use 等）
问关于 Prompt Caching 的问题

不会触发的情况：

导入 openai 或其他 LLM 提供商
通用 HTTP API 开发

使用示例

示例 1：实现 Prompt Caching

/claude-api 帮我给这个对话应用添加 prompt caching，减少 token 消耗

Claude 会分析代码并建议：

哪些内容适合缓存（系统提示、工具定义）
如何使用 cache_control 标记
如何验证缓存命中率

示例 2：模型版本迁移

/claude-api 把这个项目从 Claude 4.5 迁移到 4.7，检查是否有 breaking changes

示例 3：工具调用优化

/claude-api 我的 tool use 响应时间太长，帮我优化

示例 4：错误处理

/claude-api 帮我完善 API 调用的错误处理和重试逻辑

示例 5：Streaming 实现

/claude-api 给这个聊天应用添加 streaming 响应

常见优化

优化点	效果
Prompt Caching	减少 90% 以上的重复 token 消耗
Thinking Budget	控制推理深度和成本
Token 限制	避免超出模型上下文窗口
批量处理	减少 API 调用次数

注意事项

Prompt Caching 的最小缓存长度有限制（通常 >1024 tokens）
Caching 基于字符串完全匹配，即使一个空格不同也会 cache miss
模型版本迁移时注意行为差异，不只是 API 差异
在生产环境中务必实现指数退避重试

相关 Skills

write-a-skill — 把常用的 API 调用模式封装为 Skill
diagnose — API 调用异常排查