grep vs RAG：Claude Code 检索之争

发表于 2026/05/27

作者 puppylpg

6 分钟阅读

本文综合对比两篇观点：
为什么Claude Code不用RAG检索代码，而是用grep？
主流AI IDE的token成本爆炸？试试Claude Context！

核心争议

同一问题的两种截然不同答案：

问题：AI 编程工具如何检索代码？
小林coding：用 grep，让模型自己决策
Zilliz/Claude Context：用 RAG，以空间换时间

观点正面交锋

争议 1：grep 的精确性

小林coding观点	Zilliz观点
grep 是优点 ✓	grep 是缺点 ✗
找 `getUserById` 就只返回它，不会返回 `getUserByName`	grep 返回 99% 无关噪音，AI 被洪流淹没
精确匹配 > 向量近似匹配	语义盲：找不到 `compute_final_cost()` 与 `calculate_total_price()` 的关联

我的判断：

精确查询场景：grep 完胜（找特定函数名）
语义查询场景：RAG 完胜（找"认证相关代码"）

争议 2：RAG 的语义理解能力

小林coding观点	Zilliz观点
RAG 是缺点 ✗	RAG 是优点 ✓
向量擅长「模糊」，但代码要的是「精确」	embedding 能理解语义，函数名不同但功能相似也能匹配
找 `getUserById` 会返回一堆相似函数	grep 搜不到的语义关联，RAG 能找到

实测数据（来自 Zilliz）：

Bug 场景	grep Token 消耗	RAG Token 消耗	节省
Django YearLookup	130,819	9,036	93%
Xarray swap_dims	41,999	15,826	62%

争议 3：冷启动和实时性

小林coding观点	Zilliz观点
grep 完胜 ✓	未正面回应
grep 开箱即用，毫秒级响应	（未提及冷启动问题）
RAG 建索引要十几分钟	（宣称 5 分钟同步检测）

关键细节：Zilliz 用 Merkle Tree 做增量更新来解决「代码变动怎么办」，但未说冷启动时间。

争议 4：上下文完整性

小林coding观点	Zilliz观点
grep 有 Read 工具	RAG 更完整
Read 默认 2000 行，可分段读	每个结果包含完整上下文（类、函数、依赖）
模型按需读取，不贪心	可解释性：知道为什么召回这段代码

实际差异：

小林coding 强调「按需读取，不贪婪」
Zilliz 强调「上下文一次性给足」

争议 5：代码变动如何处理？

小林coding观点	Zilliz观点
grep 天然实时 ✓	需要工程解决
每次直接读磁盘最新版本	Merkle Tree 哈希指纹检测变化
无索引，无滞后	只对变化文件重新 embedding

关键细节：

小林coding 认为「代码每天在变」是 RAG 的噩梦
Zilliz 用 Merkle Tree + 增量更新解决，默认 5 分钟同步一次

两篇文章共同的缺陷

小林coding缺陷	Zilliz缺陷
没有实测数据	对比不公允
全是理论分析，没有 Token 消耗对比	只对比了 RAG 优势场景（语义查询）
没提 Token 成本	没提冷启动时间
多轮迭代会累积大量 Token	只说"5 分钟同步"，没说首次建索引要多久

设计哲学的根本分歧

维度	小林coding（grep 派）	Zilliz（RAG 派）
对 LLM 的判断	已足够强，能自己决策	还不够强，需要工程辅助
工程的角色	准备工具，不替模型做决定	替模型准备好材料
押注方向	模型会越来越强（长期主义）	当前效率优先（实用主义）
目标用户	单项目、探索式开发	巨型代码库、企业级

小林coding 原话：

grep 不替模型做任何决定。用还是不用、什么时候用、怎么用，全是模型说了算。

Zilliz 原话：

RAG 在代码场景的三大痛点，Claude Context 分别做了专项突破。

我的思考

两篇都对，但都在「挑对自己有利的说」

小林coding 没有实测数据，只讲 grep 的理论优势；Zilliz 只展示 RAG 胜出的案例，不提冷启动和精确查询的劣势。

场景决定选择

场景	推荐方案	理由
找特定函数 `getUserById`	grep	精确匹配，毫秒级响应
找"认证相关代码"	RAG	语义理解能找到关联函数
代码刚改完就搜	grep	实时读磁盘，无索引滞后
百万行代码库	RAG	向量检索性能更优
零配置快速上手	grep	开箱即用，无需建索引
降低 Token 成本	RAG	实测省 40%-93%

终极答案：混合检索

不是二选一，而是：

简单定向搜索 → grep
开放式语义探索 → RAG
让模型自己判断用哪种

Claude Code 已经有了「派子 agent 去探索」的机制，未来完全可以在子 agent 里集成 RAG 能力，实现混合检索。两篇文章不是对立关系，而是互补关系——grep 和 RAG 可以共存。

ai, agent

本文由作者按照 CC BY 4.0 进行授权