RAG 消失之路
RAG 终会消失 RAG 每个环节都藏着工程"暗伤": 切片策略是玄学:按段落切?按 Token 数切?重叠多少?切片粒度直接影响检索质量,却没有银弹。 Embedding 是黑盒:换个 Embedding 模型,检索效果可能天差地别。而且向量只是原文的一个"有损压缩",信息必然丢失。 索引更新是噩梦:文档改一行,可能需要重新切片、重新 Embedding、重新写入。实时性?基本别想。 基础设施是成本:Milvus、Qdrant,Pinecone……光是向量数据库的选型、部署、运维就能消耗大量精力。 详见站内专题:大模型应用技术之RAG,检索增强生成 ...