← 返回学习列表
R

RAG 实践笔记

2024-03-01

检索增强生成的落地与调优

AIRAGLLM

RAG 实践笔记

概述

RAG(Retrieval-Augmented Generation)将检索与生成结合,提升 LLM 的准确性与可追溯性。

核心组件

  • 检索器:向量数据库、关键词检索
  • 生成器:LLM 模型
  • 编排层:Prompt 构建、上下文管理

实践建议

  1. 分块策略影响召回质量
  2. 重排序可显著提升效果
  3. 控制上下文长度以控制成本