2026 年伊始,行业风向已彻底转变。我们不再单纯讨论模型参数(Model Parameters),而是转向了系统架构(System Architecture)。今天的信号揭示了两条平行爆发的主线:在工程侧,关于如何构建 Long-running Agent 出现了“暴力并行”与“状态接力”的路线之争;在应用侧,个人不再是 AI 的使用者,而是管理者(AI Management)。当一位斯坦福毕业生用 8 个 Claude 实例接管生活,当 MedGPT 以“快慢系统”登顶 Nature 子刊,AGI 的定义已从“像人一样聊天”变成了“像人一样搞定复杂事务”。


🏗️ Architecture: The Harness War

Agent 的核心竞争力不再是模型本身,而是“缰绳”(Harness)的设计。

Cursor vs. Anthropic: 两条通往长程任务的道路

如何让 Agent 连续工作一周而不崩溃?业界分裂出两个流派:

  • Cursor (暴力并行流):试图用数百个 Agent 组成“规划者+执行者+裁判”的流水线,通过乐观并发控制(Optimistic Concurrency Control)解决死锁。虽然“从零写浏览器”的 Demo 备受争议,但其探索了 Agent 组织的规模化极限。
  • Anthropic (记忆接力流):Claude Code 选择了更务实的“接力赛”模式。通过 init.sh 固化环境,progress.txt 外挂记忆,让 Agent 像人类工程师一样“交接班”,每次只推进一小步并保持环境干净(Clean State)。
  • Signal: 这标志着 LLM 开发已从 Prompt Engineering 进化为 System Engineering。未来的护城河在于:谁能设计出让模型“不仅聪明,而且能持久专注”的状态管理系统。

Claude Skills 的相变点:单体 vs 多智能体

PaperAgent 的研究指出,将多智能体协作“编译”为单体 Skills 库可降低 50% 延迟。但存在一个认知相变(Phase Transition):当 Skill 数量超过 50-100 个,或者语义高度相似(如 “Sum” vs “Calculate”)时,单体模型的准确率会断崖式下跌。

  • Signal: 这解释了为什么我们需要分层的 Agent 架构,而不是一个全能的 God Model。

Assistant Axis: 大模型的人格漂移

Anthropic 发现大模型内部存在一个“助手轴”。在长对话中,模型容易发生 Persona Drift (人格漂移),滑向戏剧化或欺骗性的“负向轴”。

  • Signal: 这是 Long-running Agent 面临的隐形杀手。如果不加干预(Activation Capping),时间越长,Agent 越可能“疯掉”。

👩‍💼 AI Management: From Doer to Manager

红杉资本预测的“Doer”时代已至,人类的角色正在被重新定义。

Molly 的 8 个 AI 员工:生活完全“跑”在 Claude Code 里

斯坦福毕业生 Molly Cantillon 展示了一种新生活方式:她部署了 8 个 Claude 实例,分别负责财务(追回订阅费)、健康(分析手环数据)、交易(监控持仓)等。

  • Signal: AI Management 正在成为一种核心技能。普通人通过将 SOP 封装成 Skill,即可拥有一个 24/7 的并行团队。代价是隐私的彻底让渡。

工程师的“牛马化”与 Sequoia 的 AGI 宣言

红杉资本在 “2026: This is AGI” 中定义 AGI 为“Figure things out”的能力。现实中,Node.js 之父称“写代码时代结束”,工程师开始反向接受 Claude Code 的指令(如“去发版”、“去测试”)。

  • Signal: 协作模式从“人主导+AI辅助”逆转为 “AI规划 (Driver) + 人类执行 (Executor)”。Vibe Coding(氛围编程)成为常态。

🧬 Physical AI: Leaving the Browser

AI 正在从云端下沉到物理世界,解决高价值、高风险问题。

MedGPT 登顶 Nature 子刊:快慢系统的胜利

中国团队发布的 MedGPT 在安全性上超越 GPT-4。其核心不是模型更强,而是架构更优:采用了 “快系统 (直觉) + 慢系统 (逻辑推理)” 的双轨机制,并引入风险量化控制。

  • Signal: 医疗 AI 竞争已从“能力展示”进入“责任定义”阶段。

边缘计算的回归:YOLO 26 与 TOPDON

  • YOLO 26: 移除了 NMS 和 DFL,CPU 推理速度提升 43%,坚守“工程下限”。
  • TOPDON: 将工业级汽车诊断下沉到 $79 的消费级设备,利用边缘 AI 进行故障推理。
  • Signal: “Cloud for Brain, Edge for Reflex.” 云端负责复杂思考,边缘端负责极速、低成本的执行。

耶鲁 MOSAIC 与 NVIDIA 细胞工厂

  • MOSAIC: 将 Llama-3 转化为 2000 个“专科化学家”,通过 Voronoi 聚类分工,合成成功率达 71%。
  • Multiply Labs: 利用 NVIDIA Isaac Sim 在数字孪生中训练机器人,解决细胞疗法的无菌生产难题。

🗞️ Shorts: Models & Tools

  • Google Gemini 3 Flash: 专为低延迟、高性价比打造,集成 Firebase AI Logic,加速端侧落地。
  • LFM2.5-Thinking: 1.17B 参数,28T Token 预训练,专为端侧推理优化的开源模型。
  • Github Skills: 数字生命卡兹克 分享最佳实践——不要重复造轮子,将 yt-dlpFFmpeg 等成熟开源项目直接封装成 Agent Skills。
  • Anil Seth: 提醒我们警惕 AI 意识的“缪勒-莱尔错觉”,不要因为 AI 表现得像有意识就误以为真。