当 LLM 能直接给答案,为什么 2026 年搜索又重新火起来了
- 作者:Bougie
- 创建于:2026-06-17
最近又开始在凌晨三点刷搜索框了,这种感觉好像回到了十几年前。那时候打开一个搜索页面,总会先盯几秒,等结果跳出来再慢慢点进去。现在呢,一秒钟不到,信息已经像水一样流进脑子里。有点奇怪,又有点舒服。
我记得大概在 2023 年左右,大家都在说搜索已经"死"了——信息流、短视频、社交媒体的推荐把搜索挤得没有空间。甚至有人喊出"搜索是上个世纪的产物"。我当时也是这么想的,在一次聚会上跟朋友说,"搜索已经不再是入口,聊天才是"。结果话音刚落,2024 年底 AI 助手的出现让搜索又悄悄回来了。

# Meilisearch 在我自己的小项目里复活了
我最直接的感受不是来自大厂,是来自我自己的小项目。之前我一直用 ElasticSearch 那种重量级的东西,部署起来像搬砖,根本不想动。后来随手把 Meilisearch 搭了一个本地搜索,结果不到两个小时,搜索速度从秒级直接掉到毫秒级,还能支持中文分词。朋友看到后直接说"这也太爽了吧",我自己也惊呼"早该这么干"。就这样,我的个人博客又开始有了搜索框,背后是 Meilisearch 在跑。
这件事让我意识到一个事:大厂做搜索是一网打尽,但垂直细分的需求往往被忽略。代码搜索、学术文献、医学影像、法律判例、电商比价——这些领域 LLM 只能给个大概,给不出内部 API 的细节、实验日志的上下文、条文的具体引用。
# Perplexity 和"答案引擎"的兴起
与此同时,Perplexity 这类新一代的"答案引擎"突然火了起来。它不只是给你一堆链接,而是直接把答案拼接出来,还会标明来源。它的出现让很多人不再满足于传统搜索的"列表+点击"模式,而是想要"直接得到答案"。

我在刷 Twitter 时看到一则热议,标题是《搜索进入答案时代》,下面几百条回复,有赞成的,也有说它太懒的。赞成的人觉得信息过载的时代直接给答案省时省力;反对的人担心它把信息源头都"埋掉"了——你读了 AI 的总结,谁还点回原始链接?我个人觉得两边都有点道理,但漏掉了一个更关键的点:来源的可信度。
LLM 的强项是生成流畅的自然语言文本,而不是实时抓取、组织海量信息。如果你问它"2025 年最新的疫苗效果如何",它大概率只能给出一个"截至 2023 年底的数据",甚至会把几个来源的结论混在一起拼凑出看似合理的答案——这在学术圈里叫"幻觉"。对于需要可验证、可追溯的场景,这种"幻觉"是致命的。
# 大模型自己为什么反过来投搜索?
说到这里你可能也想到了一个反直觉的问题:Google、Microsoft 这些大厂自己有最强的 LLM,为什么还要往搜索里砸钱?
我的猜测有三个,第三个其实是最不体面的。
第一,数据是金矿。搜索系统每天抓取数十亿网页,收集的点击行为、查询词、页面结构、语义关联,是训练和优化模型的重要资源。大公司不可能把这些肥肉拱手让给第三方 LLM 提供商。
第二,广告收入和商业模型。Google 2025 年全年广告收入大约 2600 亿美元。即便 AI 生成答案,大多数用户仍然会先打开搜索框,再点进去看"来源"。搜索引擎掌握流量入口,流量就是广告的金矿。没有搜索的抓取就没有 LLM 的原料,这是一句不太被明说但很关键的话——LLM 是厨师,搜索是食材供应链。
第三,监管与品牌控制。AI 生成内容正受到越来越多的法律审查——版权、误导性信息、仇恨言论。搜索引擎本身已经有成熟的内容审查、版权声明、删除请求流程。大公司倾向于保留搜索的"硬核"合规层,再在它上面叠加 LLM 的"软解释"。同时,当用户在搜索框里输入品牌词,期待看到的往往是官方网站、官方新闻稿、官方产品页,这些页面的呈现方式直接影响品牌形象。全靠 LLM 自动生成答案,品牌方几乎失去了对信息的"包装权"。
# 垂直搜索和"小作坊"的春天
回到独立开发者这边。AnySearch、Meilisearch、Typesense 这类工具现在非常成熟,部署成本低、扩展性强。再配合向量化检索(embedding-based search),可以在不依赖昂贵 LLM 推理的情况下实现语义匹配。独立开发者只要把数据处理好,搭起一个"搜索引擎+LLM 生成摘要"的组合,就能得到一个"AI 增强的搜索答案引擎",而不必从零打造大模型。
我前阵子帮朋友搭了一个技术文档站,用 AnySearch 把所有 Markdown 文档索引起来,结果搜索框一出现,用户直接在文档里定位到了要找的代码片段,满意度直线上升。这种"轻量级搜索"以前往往需要自己写爬虫、写索引,繁琐得很,现在已经变成了"几行代码接入"。

# 隐私这个隐形推手
还有一个更隐形的因素在推搜索回潮,那就是隐私。
前几年大家对大平台的隐私泄露事件已经麻木了,甚至出现了"放弃搜索"去"社交搜索"的趋势。可当大家意识到自己在社交平台上被算法"喂养"时,又开始怀念"自己掌控信息入口"的感觉。Meilisearch、Typesense 这些开源方案可以完全部署在本地,数据不经过第三方。配合 Llama.cpp 之类的本地模型部署,就形成了一个"离线的 AI 搜索助手"——对那些对数据安全有严格要求的行业来说,这套方案简直是救命稻草。
# 搜索 + LLM = 新的答案引擎
把这两件事缝起来的技术叫做 RAG(Retrieval-Augmented Generation,检索增强生成):先把用户 query 在搜索引擎里召回 top-k 文档,再把这些文档作为上下文喂给 LLM 生成答案。这样既利用了搜索的实时性,又利用了 LLM 的自然语言生成能力。
用户体验上也会变——从"点链接"到"点答案"。搜索结果页不再只是一堆蓝色链接,而是左侧出现一个"AI 摘要"卡片,右侧仍保留原始网页。用户可以自行决定是直接看答案,还是继续深入阅读。LLM 能根据用户的追问进行多轮对话,搜索则负责提供每一步的上下文支撑。

# 我没想明白的几个事
写到这里,我想承认几件我到现在也没想明白的事。
这波热潮会不会成泡沫? 大量资本涌入搜索,可能导致"搜索泡沫":很多小项目盲目套用 RAG,却忽视了底层数据质量和索引更新的成本,最终只能靠投资人输血维持。
LLM 自己会不会革掉搜索的命? LLM 的能力在飞速提升,成本也在下降。如果有一天 LLM 能够在秒级、低成本、实时地抓取并推理全网信息,搜索引擎的壁垒就会被进一步侵蚀。
搜索会不会变成"元能力"? 现在的年轻人已经习惯在社交媒体上直接提问,搜索引擎的"入口"属性正被聊天机器人侵蚀。未来的搜索可能不再是"打开浏览器"的那个动作,而是渗透到我们日常的每一个交互里,变成一种背景服务。
回到开头那个问题——搜索是不是过时了?我现在不这么认为了。技术一直在循环:搜索 → 信息爆炸 → AI 崛起 → LLM 能给答案 → LLM 幻觉 → 用户仍需可信来源 → 搜索的价值被重新审视 → 搜索+LLM → RAG → 新的答案引擎 → 又一轮投资。
每一次技术的突破都会让人担心旧事物被淘汰,但旧事物往往在"升级"而不是"消亡"。大公司重新押注搜索,是因为他们看清楚了"搜索仍然是信息的管道,AI 是管道的阀门";独立开发者则是看准了"阀门太贵,管道可以自己搭"。
凌晨三点的搜索框没变,只是背后跑的东西变了。