当 LLM 能直接给答案，为什么 2026 年搜索又重新火起来了

作者：Bougie
创建于：2026-06-17

最近又开始在凌晨三点刷搜索框了，这种感觉好像回到了十几年前。那时候打开一个搜索页面，总会先盯几秒，等结果跳出来再慢慢点进去。现在呢，一秒钟不到，信息已经像水一样流进脑子里。有点奇怪，又有点舒服。

我记得大概在 2023 年左右，大家都在说搜索已经"死"了——信息流、短视频、社交媒体的推荐把搜索挤得没有空间。甚至有人喊出"搜索是上个世纪的产物"。我当时也是这么想的，在一次聚会上跟朋友说，"搜索已经不再是入口，聊天才是"。结果话音刚落，2024 年底 AI 助手的出现让搜索又悄悄回来了。

search-is-back

# Meilisearch 在我自己的小项目里复活了

我最直接的感受不是来自大厂，是来自我自己的小项目。之前我一直用 ElasticSearch 那种重量级的东西，部署起来像搬砖，根本不想动。后来随手把 Meilisearch 搭了一个本地搜索，结果不到两个小时，搜索速度从秒级直接掉到毫秒级，还能支持中文分词。朋友看到后直接说"这也太爽了吧"，我自己也惊呼"早该这么干"。就这样，我的个人博客又开始有了搜索框，背后是 Meilisearch 在跑。

这件事让我意识到一个事：大厂做搜索是一网打尽，但垂直细分的需求往往被忽略。代码搜索、学术文献、医学影像、法律判例、电商比价——这些领域 LLM 只能给个大概，给不出内部 API 的细节、实验日志的上下文、条文的具体引用。

# Perplexity 和"答案引擎"的兴起

与此同时，Perplexity 这类新一代的"答案引擎"突然火了起来。它不只是给你一堆链接，而是直接把答案拼接出来，还会标明来源。它的出现让很多人不再满足于传统搜索的"列表+点击"模式，而是想要"直接得到答案"。

answer-engine

我在刷 Twitter 时看到一则热议，标题是《搜索进入答案时代》，下面几百条回复，有赞成的，也有说它太懒的。赞成的人觉得信息过载的时代直接给答案省时省力；反对的人担心它把信息源头都"埋掉"了——你读了 AI 的总结，谁还点回原始链接？我个人觉得两边都有点道理，但漏掉了一个更关键的点：来源的可信度。

LLM 的强项是生成流畅的自然语言文本，而不是实时抓取、组织海量信息。如果你问它"2025 年最新的疫苗效果如何"，它大概率只能给出一个"截至 2023 年底的数据"，甚至会把几个来源的结论混在一起拼凑出看似合理的答案——这在学术圈里叫"幻觉"。对于需要可验证、可追溯的场景，这种"幻觉"是致命的。

# 大模型自己为什么反过来投搜索？

说到这里你可能也想到了一个反直觉的问题：Google、Microsoft 这些大厂自己有最强的 LLM，为什么还要往搜索里砸钱？

我的猜测有三个，第三个其实是最不体面的。

第一，数据是金矿。搜索系统每天抓取数十亿网页，收集的点击行为、查询词、页面结构、语义关联，是训练和优化模型的重要资源。大公司不可能把这些肥肉拱手让给第三方 LLM 提供商。

第二，广告收入和商业模型。Google 2025 年全年广告收入大约 2600 亿美元。即便 AI 生成答案，大多数用户仍然会先打开搜索框，再点进去看"来源"。搜索引擎掌握流量入口，流量就是广告的金矿。没有搜索的抓取就没有 LLM 的原料，这是一句不太被明说但很关键的话——LLM 是厨师，搜索是食材供应链。

第三，监管与品牌控制。AI 生成内容正受到越来越多的法律审查——版权、误导性信息、仇恨言论。搜索引擎本身已经有成熟的内容审查、版权声明、删除请求流程。大公司倾向于保留搜索的"硬核"合规层，再在它上面叠加 LLM 的"软解释"。同时，当用户在搜索框里输入品牌词，期待看到的往往是官方网站、官方新闻稿、官方产品页，这些页面的呈现方式直接影响品牌形象。全靠 LLM 自动生成答案，品牌方几乎失去了对信息的"包装权"。

# 垂直搜索和"小作坊"的春天

回到独立开发者这边。AnySearch、Meilisearch、Typesense 这类工具现在非常成熟，部署成本低、扩展性强。再配合向量化检索（embedding-based search），可以在不依赖昂贵 LLM 推理的情况下实现语义匹配。独立开发者只要把数据处理好，搭起一个"搜索引擎+LLM 生成摘要"的组合，就能得到一个"AI 增强的搜索答案引擎"，而不必从零打造大模型。

我前阵子帮朋友搭了一个技术文档站，用 AnySearch 把所有 Markdown 文档索引起来，结果搜索框一出现，用户直接在文档里定位到了要找的代码片段，满意度直线上升。这种"轻量级搜索"以前往往需要自己写爬虫、写索引，繁琐得很，现在已经变成了"几行代码接入"。

local-search

# 隐私这个隐形推手

还有一个更隐形的因素在推搜索回潮，那就是隐私。

前几年大家对大平台的隐私泄露事件已经麻木了，甚至出现了"放弃搜索"去"社交搜索"的趋势。可当大家意识到自己在社交平台上被算法"喂养"时，又开始怀念"自己掌控信息入口"的感觉。Meilisearch、Typesense 这些开源方案可以完全部署在本地，数据不经过第三方。配合 Llama.cpp 之类的本地模型部署，就形成了一个"离线的 AI 搜索助手"——对那些对数据安全有严格要求的行业来说，这套方案简直是救命稻草。

# 搜索 + LLM = 新的答案引擎

把这两件事缝起来的技术叫做 RAG（Retrieval-Augmented Generation，检索增强生成）：先把用户 query 在搜索引擎里召回 top-k 文档，再把这些文档作为上下文喂给 LLM 生成答案。这样既利用了搜索的实时性，又利用了 LLM 的自然语言生成能力。

用户体验上也会变——从"点链接"到"点答案"。搜索结果页不再只是一堆蓝色链接，而是左侧出现一个"AI 摘要"卡片，右侧仍保留原始网页。用户可以自行决定是直接看答案，还是继续深入阅读。LLM 能根据用户的追问进行多轮对话，搜索则负责提供每一步的上下文支撑。

search-and-llm

# 我没想明白的几个事

写到这里，我想承认几件我到现在也没想明白的事。

这波热潮会不会成泡沫？ 大量资本涌入搜索，可能导致"搜索泡沫"：很多小项目盲目套用 RAG，却忽视了底层数据质量和索引更新的成本，最终只能靠投资人输血维持。

LLM 自己会不会革掉搜索的命？ LLM 的能力在飞速提升，成本也在下降。如果有一天 LLM 能够在秒级、低成本、实时地抓取并推理全网信息，搜索引擎的壁垒就会被进一步侵蚀。

搜索会不会变成"元能力"？ 现在的年轻人已经习惯在社交媒体上直接提问，搜索引擎的"入口"属性正被聊天机器人侵蚀。未来的搜索可能不再是"打开浏览器"的那个动作，而是渗透到我们日常的每一个交互里，变成一种背景服务。

回到开头那个问题——搜索是不是过时了？我现在不这么认为了。技术一直在循环：搜索 → 信息爆炸 → AI 崛起 → LLM 能给答案 → LLM 幻觉 → 用户仍需可信来源 → 搜索的价值被重新审视 → 搜索+LLM → RAG → 新的答案引擎 → 又一轮投资。

每一次技术的突破都会让人担心旧事物被淘汰，但旧事物往往在"升级"而不是"消亡"。大公司重新押注搜索，是因为他们看清楚了"搜索仍然是信息的管道，AI 是管道的阀门"；独立开发者则是看准了"阀门太贵，管道可以自己搭"。

凌晨三点的搜索框没变，只是背后跑的东西变了。

< 为什么 Claude Code 选择了 shell，而不是 JSON Schema

小伙伴们

Conan06's blog
联系方式

邮箱：bougie.liu@qq.com

留言：点击留言