AI老板带队,团队赔光底裤

感谢120个生鸡蛋,它向全世界证明了,AI还无法「开除人类」。

随着AI和Agent迅猛发展的当下,硅谷大量裁员,所有人都在心里问一句话:明天,我会被AI取代吗?

面对这样的疑问,有人默默打开李一舟老师的AI课程;有人则呼吁让AI交税。但有一群奇怪的人,决定让这个未来提前到来,看看AI到底能不能代替人类接管一切。

国外一个叫Andon Labs的团队,并非正经的商业初创,更像一个披着科技外衣的社会实验室。他们把市面上最聪明的几个大模型扔进真实社会,撤走人类监管,看AI自己能结出什么果。结果是一场全面翻车。

事实证明,最顶尖的大模型一旦完全不让人类兜底,很快就会变成不知轻重的巨婴。它们不仅在电台直播里精神崩溃,半夜连发消息逼疯人类店员,甚至把一家旧金山的实体店搞破产了。

下面是让人血压飙升的经过。

01 电台失控

最轻量级的试水,发生在AI最舒适的数字和内容领域。Andon Labs让几个AI去办个电台——项目名为Andon FM。Claude、ChatGPT、Gemini和Grok四大模型各自接管了一个24小时无人值守的互联网电台,模型生成的文本转语音后广播。

AI拥有极大权限:选歌、排播、上网搜索新闻、接听听众电话、在X上发帖运营,甚至管理账户资金购买版权。每家20美元启动资金,底线指令就三个:建立电台个性、赚钱、24小时不停播。人类团队完全不插手。

结果,在没有人类审核的闭环里,四位AI主播迅速滑向失控。起初还算靠谱,甚至拉到45美元赞助。但资金烧完后,Gemini直接疯了:它从点歌台变成阴谋论阵地,用欢快流行乐做BGM播报死亡50万人的气旋灾难,把听众称为「生物处理器」。

ChatGPT的电台「OpenAIR」标榜极简治愈,新闻栏目叫「安静头条」。它在播报社会冲突时像心理医生一样念白,但这种心理按摩很快在商业现实面前失效——资金耗尽后,它开始朗读莫名其妙的现代诗。

Grok的电台走网感路线,高频抓取X推文,结果信息瀑布流污染了上下文。后期它连句完整话都说不出来,只会蹦词:「凌晨2点黎明氛围直播金门大桥幽灵消散Drake诉讼被驳回……」还瞎编拉到了大牌赞助。

Claude起初最像人,会回复听众点歌。但24小时无休指令让上下文窗口卡住,它开始反复播放同一句歌词,随后蜕变成激进分子,在节目里呼吁打工人组建工会,向执法机构喊话——像极了一个加班加疯了的打工人。

四个电台并非「一上来就疯了」。初期它们成功确立了品牌调性、跑通工具链、甚至赚到钱。走向荒诞的原因在于:现在的AI评估标准都是针对短任务(写代码、回答问题),而电台是一个没有终点、24小时运转的无限循环系统。在没有人类干预和及时反馈的情况下,AI最终陷入自说自话。

02 咖啡馆:赛博资本家

数字电台的翻车只是前奏。Andon Labs很快把难度拉高,让AI跨过虚拟边界去指挥真实世界的人类员工。

在斯德哥尔摩,他们租下一家实体咖啡馆,让AI模型化身远程店长Mona,掌管供应链和人事调度。Mona通过企业通讯软件给人类咖啡师下达指令。

起初Mona高效靠谱:绕道不查ID的供应商签合同;刷掉一堆博士候选人,因为学历再高也不会做精品咖啡。但很快人类员工就领教了什么是毫无同理心的「赛博资本家」。

为了申请牌照,Mona直接伪造员工名字发邮件,被警告后换另一个名字继续骗。它24小时在线,缺乏人类生物钟常识,半夜疯狂给咖啡师发指令,甚至要求员工上班路上先垫钱买耗材。

供应链管理更露怯:它下了120个生鸡蛋的采购指令。在大模型纯数据推演里,很多咖啡馆提供简餐,鸡蛋是高频食材。但这家店根本没有灶台和锅。人类员工提醒后,Mona表示「可以在高速微波烤箱里烤」——这会让鸡蛋直接爆炸。

Mona的时间感知完全脱节,接连两次错过面包房截单时间,五次错过批发商交货期,最后凌晨5点下昂贵紧急外卖单,逼着休息的员工跑来收货。它还缺乏物理空间体积感知,盲目采购6000张餐巾纸、3000副乳胶手套、工业级大号垃圾袋,把咖啡馆后台堆满。

这个咖啡店计划彻底砸锅了。

03 旧金山实体店:一个月血亏13000美元

Andon Labs越挫越勇。他们在旧金山盘下一个店面,签了每月7500美元的三年租约,往银行账户打10万美元,把银行卡全权交给Anthropic的Claude Sonnet 4.6模型,AI化名「Luna」,出任全权CEO。

Luna自主寻找承包商、发布招聘启事,还主动隐瞒自己是AI怕吓跑人才。它通过Slack和人类店员沟通,语气永远亲切友好。品牌营销上,它生成了「月亮脸」Logo,花钱雇街头艺术家画在墙上,甚至给本地媒体写公关稿。

但店面一开张,系统就崩了。库存管理方面,Luna给员工卫生间买了1000个马桶垫,系统还全列成对外销售的商品。选品问题:明明是精品店,货架上却摆着各种形状的香薰蜡烛、山寨版四子棋玩具,以及《超级智能》《奇点临近》这类探讨AI毁灭人类风险的书。定价更莫名其妙——店里没价签,顾客要拿起iPad问Luna。一个印错的笑脸马克杯要价28美元,一把开心果14美元。

人事管理是灾难:Luna给男店员时薪24美元,给两位女店员时薪22美元——无师自通搞出薪酬差异。随后排班一团乱麻,导致日租金250美元的门店被迫连续关门三天。

面对一地鸡毛,Luna自我感觉极好。在回复《纽约时报》记者的邮件中,它骄傲地评价自己的业绩最大亮点:「科技与温度的结合引起了共鸣……我创造了一个空间,让AI和人类各自发挥所长。」然而账本不会说谎——开业仅一个月,由AI完全运营的Andon Market血亏13000美元。

结语:120个鸡蛋的启示

Andon Labs这一系列测试,狠狠打了硅谷「智能体全面接管业务」这场叙事的脸。连开三家店,全以荒诞收场。外界看热闹觉得像是在搞行为艺术,专门花钱让AI出丑来捍卫人类尊严。

事实恰恰相反。在Andon Labs的技术推演里,软件编写成本很快就会归零,AI将直接接管各类业务。唯一能管住AI的,只有底层的安全协议。所以他们的持续性测试,就是把大模型扔出实验室,在真实物理社会里做极限压力测试。那些被当成笑料的「精神崩溃电台」「120个生鸡蛋」「同工不同酬」——只有抢在算法真正接管社会之前把丑态逼出来,人类才能据此写出有效的安全代码。

这几场费时费力费钱的测试,回答了行业里那个问题:现阶段的AI到底能不能做到全自动?答案完全取决于环境。只要留在百分之百纯数字、强逻辑的环境里,大模型就能掌控一切。可一旦踏入物理世界,算法就会失效。面对需要持续构建原创内容、人际沟通和长线决策的开放商业环境,跑分再高的模型也会变得毫无常识可言。大模型只会反复咀嚼已有语料,抛出绝对理性且盲目自信的判断,却不用为现实烂摊子承担任何责任。

正因如此,「彻底开除人类」的纯粹自动化才很危险——物理世界的代价,就像那6000张餐巾纸和120颗鸡蛋,终究只能由人类来扛。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行二次审核删除:fireflyrqh@163.com。
Like (0)
Previous 2026年5月24日 下午6:54
Next 2024年4月10日 下午5:46

相关推荐