分支② 扎根知识
这条分支补主干的哪块缺口: 原始模型「只知道训练时见过的、和你这次塞进去的那点文字」。这条分支(RAG / 上下文工程)在模型回答前,先去外部资料里检索相关片段、拼进上下文,让答案扎根在真实材料而非模型的模糊记忆上。
1. 这条分支是什么(第一性原理)
模型的知识是「训练时冻结的 + 你这次塞进上下文的」。你公司的文档、此刻的网页、那份 PDF,它都不知道。直接问 → 它要么说不知道,要么编一个。
RAG(检索增强生成)的思路极简单:先检索,再生成。
文档/网页/PDF/视频 用户问题
│ │
▼ (离线:切块 → 嵌入 → 存索引) ▼ (在线)
┌─────────────┐ ┌──────────────┐
│ 知识索引 │◄──────检索────│ 把问题向量化 │
│ (向量/图/KV) │──相关片段──┐ └──────────────┘
└─────────────┘ ▼
┌────────────────────────┐
│ 把「相关片段 + 问题」一起 │──► 模型基于真材料作答
│ 拼进上下文喂给模型 │
└────────────────────────┘
分支里的库,差别在三件事:怎么切块/解析、索引建成什么结构(向量?图?)、检索和拼装的流程怎么组织。