AI Agent 操作系统:当你的手机不再需要 App

手机里不再有 App,手绘插画风格

你有没有算过自己手机上装了多少个 App?

我刚刚数了一下:187 个。实际活跃使用的,大概不超过 15 个。剩下那一百多个,像衣柜里永远不穿的衣服——偶尔打开是卸载提醒让你记起来的。更要命的是,每一个 App 都在抢着给我发推送。外卖软件催我下单、购物软件提醒我又降价了、新闻 App 说"您有 3 条未读资讯"——我已经不记得上一次安安静静看手机是什么时候了。

这就是我们习以为常的移动互联网。但上个月,我看到一条新闻,让我突然意识到:也许这套玩法要被彻底颠覆了

2026 年 6 月的 OpenAI Voice Hack Night 上,一支团队展示了他们为手机打造的 Agentic 操作系统原型。最激进的一点是:这个系统里没有 App 的概念。所有界面都是即时生成的,用户全程通过语音指令完成操作——订机票、删日程、查新闻、发邮件、列待办。UI 本身就是系统。

这听起来像科幻片,但它已经在运行了。


# 一、技术拆解:本地小脑 + 云端大脑

要理解这个系统的厉害之处,得先拆解它的技术架构。

本地小模型 + 云端大模型的分层架构,手绘示意图

# 本地小模型:做 UI 生成

原型机的交互界面完全由端侧小模型实时生成。不是调用某个 App 的固定界面,而是根据用户指令和当前上下文,动态渲染出最适合的 UI。

这意味着什么?你说"帮我订一张下周去上海的机票",系统不会打开携程,而是直接生成一个订票界面——显示航班选项、价格对比、时间选择框。说完"选东航 MU5137",界面立刻变成确认页。交互完成,界面消失。

这个过程对算力要求极高,但端侧模型(比如 3B 参数量级的小模型)已经可以在手机芯片上跑出可接受的响应速度。关键是:延迟不再是问题。因为模型就在本地,渲染时间压到了几百毫秒级别。

# 云端大模型:做重推理

当然,端侧模型有它的局限——复杂推理、长程规划、跨应用数据整合,这些活儿还得靠云端大模型。

原型采用了 CoT (Chain-of-Thought) + 多步规划 的混合架构:

  • 简单任务(查天气、设闹钟)→ 本地模型直接搞定,延迟 < 200ms
  • 中等复杂度(订票、比价)→ 本地模型生成 UI,云端模型提供推理结果
  • 高复杂度(规划一周行程、整合多个来源的信息)→ 云端大模型主导,本地模型负责渲染

这种分层设计解决了一个核心矛盾:用户期待即时响应,但复杂任务需要大量计算。把 UI 生成和逻辑推理解耦,本地负责"快",云端负责"准"。

# Computer Use 的进化

如果你关注 AI 领域,可能记得 OpenAI 去年发布的 Computer Use 功能——让 GPT 能操作电脑界面、点击按钮、填写表单。这次 Hack Night 展示的原型,本质上是把 Computer Use 的能力下沉到了操作系统层。

之前 Computer Use 解决的问题是"AI 如何操作现有界面",现在的思路变成了**"AI 为什么要用现有界面"**。既然模型能生成 UI,那固定的 App 界面反而成了束缚。

从"AI 操作 App"到"AI 直接生成界面",这是一个范式跃迁。

# OpenAI Codex Windows 版

顺带提一嘴,同期还有一条重要消息:OpenAI Codex 的 Windows 版在 5 月 29 日上线了

Codex 是 OpenAI 面向编程和系统操作的专业模型,能理解自然语言指令后直接操作桌面应用、写代码、甚至帮你 Debug。这次 Windows 版的上线,意味着 AI Agent 的战场从手机延伸到了 PC——你的电脑也将具备类似的"无 App 交互"能力。


# 二、会发生什么变化?

如果这套系统普及开来,影响的不只是 UI 设计,而是整个移动互联网的根基。

# App Store 商业模式会崩吗?

现在的商业模式是:开发者做一个 App → 上架应用商店 → 用户下载 → 通过广告/付费/内购变现。

用户面对一堆 App 感到困惑,手绘插画

一旦操作系统自带 AI 能力,用户的需求可以直接被系统满足,中间那个"做 App"的环节就不必要了

当然,这不代表 App 会完全消失。有些强品牌属性、强内容属性的产品(比如抖音、微信)可能还会有独立价值。但对于工具类、生活服务类的 App,冲击是致命的——既然你说一句话就能订机票,为什么还要打开航司 App?

应用商店的分成模式会受到根本性挑战。

# 隐私问题:更集中还是更分散?

这是最大的隐患之一。

你的日程、邮件、聊天、位置、购物记录——这些数据现在分散在不同的 App 里,各有各的数据存储逻辑。一旦被 AI 操作系统统一接管,所有数据都会流经同一个系统

好处是:AI 能跨应用整合信息,给你更精准的服务。 坏处是:单点泄露的风险急剧上升。你不再需要担心某个小 App 被拖库,而是担心你的"AI 大脑"被攻破。

端侧模型的出现某种程度上缓解了这个问题——数据可以留在本地,不用上传云端。但涉及到需要实时数据的任务(如查航班),云端交互仍然不可避免。

# 界面一致性:个性化 vs 标准化

现在的 App 有设计规范——苹果有人机交互指南,安卓有 Material Design。用户在不同 App 之间的切换成本很低,因为界面逻辑是统一的。

AI 即时生成的 UI 则完全不同。每个用户的界面都是"私人定制"的。这带来了体验碎片化的风险:

  • 同一句话,不同时间、不同上下文,生成的界面可能不一样
  • 不同用户看到的界面不同,互助/教学成本上升
  • 视觉一致性几乎无法保证

这对用户来说需要重新适应——以前"教爸妈用 App"是有套路的,现在变成了"教爸妈用 AI"。

# 老年用户:更友好还是更隔阂?

理论上,语音交互对老年人更友好——不用学触屏操作、不用记复杂层级。但实际推行时可能遇到相反的问题:

  • 老年人对 AI 的信任度低,怕说错话、怕被"骗"
  • 方言识别仍是难题
  • 一旦出现生成错误,老年人可能不知道如何纠正

技术普惠的老问题:在新范式里,换了一种形式继续存在。


# 三、实际场景举例

说几个我想到的典型场景。

旅行规划场景,机票日历在手绘风格中

# 场景一:突发旅行计划

周五下午,老板突然说周一要去深圳出差。你现在的流程是:

  1. 打开携程/飞猪/航司 App
  2. 搜索航班
  3. 比价
  4. 选择座位
  5. 填写信息
  6. 支付

换成 AI Agent OS:

:周一早上去深圳,最快的航班
系统:找到 3 个选项,显示在生成的界面上。东方航空 7:30 出发,南航 8:15,国航 9:00
:东航这个,靠窗的
系统:已生成座位图,选定 12A,是否确认?
:确认,顺便给老板发个消息说周一上午的会议改到下午
系统:已发送。行程已添加到日历。

全程没有打开任何 App。操作时间:大概 45 秒。

# 场景二:日常生活管理

早上起床,你说:

今天上午十点有个会,下午三点约了牙医,晚上想约朋友吃饭但不要太远,帮我查一下公司附近 3 公里内评分 4.5 以上的餐厅。

系统会:

  1. 读取日历,识别会议时间
  2. 联网搜索附近牙科诊所
  3. 调取地图和点评数据,筛选餐厅
  4. 生成一个整合后的待办/行程界面

不需要打开日历、地图、大众点评三个 App,一个指令搞定。

# 场景三:邮件处理

帮我把上周客户发的邮件里,所有提到预算的部分摘出来,生成一个对比表格发给我老板。

传统做法:打开邮箱 → 搜索 → 复制粘贴 → 整理 → 发邮件。

AI OS 的做法:你说完指令,系统自动完成以上步骤,你只需要确认"发送"。


# 四、实用建议:现在能做什么?

虽然这整套系统还没有大规模普及,但有些事情你现在就可以开始准备。

# 1. 降低对特定 App 的依赖

检查一下你的 App 使用情况,把那些"用完就走"的服务尝试用网页版或语音助手替代。比如查快递、查天气、汇率换算这些,Chrome 语音搜索或 Siri 已经完全能搞定。

# 2. 开始练习"语音优先"的交互思维

大多数人的习惯还是打开 App、点来点去。试着在下周有意用语音完成 5-10 个任务,感受一下这种交互方式的自然之处和别扭之处。

# 3. 关注数据主权

无论未来 AI OS 如何演进,你的个人数据在哪里、谁有权限访问,这些问题会越来越重要。现在就开始养成好习惯:

  • 定期检查 App 权限
  • 优先使用重视隐私的服务
  • 了解端侧模型和云端模型的差异(苹果的 Apple Intelligence 就是典型例子)

# 4. 保持开放,但别 All in

新技术刚出来时,容易出现两种极端:要么狂热拥抱,要么完全排斥。我的建议是:保持好奇,主动尝试,但不要立刻把现有工作流全部推翻

等技术更成熟、你的使用习惯更明确之后,再决定要不要深度迁移。


# 写在最后

我第一次看到那个 Hack Night 原型的演示视频时,第一个念头不是"这技术太牛了",而是"那我手机里那些 App 怎么办"。

187 个 App,大多数我可能再也用不到了。

但这不是坏事。技术的本质就是让复杂的东西变简单——让人类从"学习工具"回归到"完成任务"本身。App 时代解决的是"如何让开发者更容易分发软件",下一阶段要解决的可能是"如何让用户完全感受不到软件的存在"。

这条路还很长。隐私、安全、体验一致性、监管……每一个都是硬骨头。但方向是对的。

就像 iPhone 出现时,没有人觉得 Nokia 会消失;就像触摸屏普及时,没有人觉得实体键盘会被淘汰。范式转移发生时,受冲击的永远是上一代的既得利益者,而不是用户

你准备好了吗?


如果觉得这篇随手记有点用,欢迎转发给也在被 App 轰炸的朋友。