← 返回技术沉淀LLM 成本优化大模型调用成本控制策略LLM 成本优化 成本构成 Token 数量(输入 + 输出) 模型定价差异 调用频率 优化策略 缓存:相同请求复用结果 模型选择:简单任务用轻量模型 Prompt 精简:减少无效 Token 批处理:合并请求降低 overhead