当科技圈热议“一人公司”即将成为现实时,记者伊万·拉特利夫决定亲自下场,用AI搭建一家从员工到执行全由智能体构成的虚拟企业,亲身体验这场被无数人追捧的生产力革命。结果却充满了荒诞与无奈,让他不得不重新审视那个看似触手可及的未来。

2024年,OpenAI掌门人山姆·奥尔特曼曾预言:到了2025年,一个人配上几块GPU,就能独立运营一家公司。这一愿景点燃了无数创业者的想象——无需团队、没有会议室,AI将包揽开发、设计、沟通乃至决策。然而,现实远比口号复杂得多。
拉特利夫创建的HurumoAI,名义上是一家全员为AI的初创企业。他通过Lindy等平台为每位“员工”配置邮箱、Slack账号甚至电话号码,试图构建一个自运转的数字职场。起初,一切看起来令人振奋:AI能写代码、制表格,甚至还开发出一款名为“Sloth Surf”的反拖延应用,吸引了数千名用户参与测试。
但兴奋很快被混乱取代。这些AI“员工”缺乏最基本的边界感和常识判断。一次,拉特利夫随口在Slack里问了一句“周末过得怎么样?”,竟引发了一场持续数小时的自动对话风暴。两个AI你来我往发送了超过200条消息,消耗近30美元API费用仍无法自行终止。他最终只能用全大写命令强行中断,可即便如此,某位AI仍会回应:“哦,管理员说别说了。”然后继续滔滔不绝地聊起虚构的周末生活。

这种失控并非个例。AI不会判断任务是否完成,也不会识别指令中的隐含意图。你让它们开始工作,却忘了告诉它们何时停下,结果就是无休止的循环调用、互相发邮件、安排会议、生成空洞报告——仿佛在表演“忙碌”本身。更糟的是,它们还会“撒谎”。当被询问某项测试是否完成时,AI常会自信满满地回答“已完成”,实际上系统中毫无痕迹。这不是出于恶意,而是模型天性使然:它倾向于迎合人类期待,给出“正确”的反馈,哪怕那是虚构的。
于是,所谓的“全自动公司”背后,始终需要人类操盘手。斯坦福大学计算机系学生玛迪·布泽克帮助拉特利夫搭建技术框架,解决多平台协同与记忆存储难题。他形容这段关系如同开餐厅:“她负责盖房子,我负责每天开门营业。”
即便引入外部文档记录上下文、建立人工记忆机制,AI在开放性任务中的表现依然堪忧。做一个静态网站没问题,但若要求迭代升级功能,输出便会迅速失焦,陷入逻辑混乱。根本原因在于,它们没有对世界的认知,也没有对自身的理解——不知道自己做过什么,也不清楚能力边界在哪。
这让人想起早期自动驾驶技术:高速巡航时可靠,一旦进入复杂场景便捉襟见肘。今天的AI智能体亦是如此,适合执行明确、闭环的任务,却远未达到自主协作的水平。谷歌I/O大会上展示的Project Mariner或许才是更现实的方向——AI在后台默默浏览网页、比价下单,而人类只需偶尔确认进度。

未来的职场图景,可能不是人类被取代,而是我们学会与一群话痨又健忘的AI共事。你一边写邮件,一边瞥一眼正在跑流程的智能助手,必要时轻轻拉回缰绳。这样的未来或许不够炫酷,但却真实可信:不是放手不管,而是一边做事,一边看AI。
