Jason Ye

Writing · essay

我把 AI agent 做成了自己的个人操作系统

我越来越少想「哪个模型更强」,越来越多想「怎么把自己的数字世界编成系统」。

2026-05-23 · 约 2 分钟


我现在越来越不把 Codex、Claude 这些东西当「聊天工具」看。

更准确地说,我在试着把它们做成自己的个人操作系统

让我第一次很清楚意识到这件事的,是 remote control 这条线:人在外面时,手机上发起任务,桌面端接住,继续把开发往前推。它让我想明白一件事——agent 真正有价值的地方,不只是会回答,而是可以被调度

到这一步,我越来越少在想「哪个模型更强」,而是在想怎么把自己的数字世界编成系统。我现在的系统大概是五层:

1. 先有一个看盘层

我要一个能看见全局的界面:项目、线程、review、终端、自动化,收成一个我一眼能看清的工位。对我来说,这一层最重要的价值不是回答问题,而是让我看得见整个摊子在发生什么。

2. 再有一个做事层

复杂实现、长链路推理、方案拆解,我还是很常交给 Claude Code。真正省力的不是让一个工具包打天下,而是让每个工位各司其职:一个负责看盘,一个负责深活。

3. 然后把系统接到现实世界

routines、SSH、服务器、发布流程、机器人——这些东西一接上,agent 才不只是会聊天,而是能持续推进真实工作。能调度现实,才算系统。

4. 再给它规则和记忆

CLAUDE.md / AGENTS.md 管「怎么做」,knowledge index 管「知道什么」,工作日志把今天和明天接起来。到了一定规模,这些就不再是零散笔记,而是一套真的会积累的知识层——这也是我在 Founder OS 里反复强调的「上下文」那一层。

5. 最后,买回连续性

做到哪了、下一步是什么、今天做了哪些决定、明天最该接什么,都不该只活在我的脑子和聊天记录里。系统帮我把「连续性」存下来,我才不用每天从零重新加载自己。


所以我现在理解的「个人指挥中心」,不是一个很酷的 dashboard。

它更像一套慢慢长出来的操作系统:

你能从手机调度; 它能在桌面执行; 它记得你过去做过什么; 明天还能接着今天继续往前走。

抛砖引玉。这个方向我感觉上限很高,而且越往下做,越会逼着你把 agentic engineering 真正学明白。