世界是个游乐场

alt 这是一张 Banana Pro(Gemini 3 Pro)生成的卡通风格的 milet 的照片,原图取自她的《Walkin’ In My Lane》的专辑封面。我很满意这个图片处理的效果。Banana Pro 已经火爆了很长时间,直至现在我这次才是真正上手体验。拖延不是一件好事情,原本很容易领取到的 Gemini 3 Pro 学生年卡,现在变得极度困难。我也是在此时意识到,如果不是美区延长了领取时限,这个活动早在25年底就结束了。为了领到这个年卡,我从昨天晚上折腾到今天上午,最后也没有成功,然而过程中的确是乐此不疲的。谷歌的审查力度经历了几轮加码。节点、历史位置推断、付款信息导致的地区不符合领取资格;教育邮箱的注册、学生认证信息的生成和代认证工具,校验机制和破解方法的较量始终在进行。最后的最后,我花了些钱去买了个家庭组方案,也算是用上了 Gemini 3 Pro。

从结果论,我的这番折腾是失败的,不如早早地行动或者花钱一步到位。但我总是陷入各种各样折腾的兔子洞里面,无论成功与否。

上周我才开始真正体验 vibe coding 的美妙。在这个词兴起之前,我曾用过很长一段时间的它的鼻祖 cursor,后来因为种种原因很久没再接触 agent 工具。长久以来,在 vibe coding 已经大火的当下,我还是依靠:1. 在网页端 ChatGPT 生成代码再复制回来; 2. 使用 Copilot 的提示补全功能 来做代码工作。这次,我才真正开始使用 droid、Claude code 这类先进的 agent cli。用过之后才知道,写代码的工作流程发生了很大的改变,通过自然语言已经能够完成绝大多数的需求撰写和代码编辑,几周前我还在经历的来回复制粘贴的苦力活完全是可以避免的。

起初,推动我去尝试新的 AI 工具并非「提高生产力」的号召(尽管它确实做到了),而是我当时在探索自己做一个小玩意的好奇心。我在自己的小项目当中玩耍的过程中,对此类 agent 工具的使用变得得心应手。一两周之后,我自然而然地将这种经验迁移到了工作场景当中。比起在网页端提问然后复制过来的方法,agent cli(Command-Line Interface,命令行界面程序) 并不会带来体验上的质的飞跃。不过,这种小小的改变随着时间的推移,实际积累的效率的提升是显著的。

跟 AI 相关的工具,在当下可谓是日新月异。媒体上不乏对最新技术或者产品的追踪报道,几乎没有人不知道它们的存在。但也正是如此,人们对工具的评价并不会形成稳定的、统一的共识,以及工具的生存周期存在着高度不确定性。我们知道,学习任何新的工具都需要支付一定的学习成本,而在 AI 产品变化太快、实际效益未能达成共识的当下,很多人并不愿意、也没有强烈的动机去尝试一款新的工具。因为从功利性(如提高生产效率)的角度出发,这笔买卖看起来不划算。就像我折腾了一两周去探索 agent cli,最后编程的效率未必会显著胜过从网页问答当中复制过来的方式。此外,这类专业性的工具并不像大众化的产品那么方便,终端安装和调用的方式本身就需要一定的计算机基础,对于不熟悉的人而言这些是十足的阻碍(尽管在过来人眼中是纸老虎);而且,在国内使用这些还没有做本土化适配的产品,天然就产生了更多的学习成本(网络问题、支付问题、平替三方API问题),对国人而言的门槛相应提高了很多。从习惯培养的角度来看,行动路径上一点点摩擦力的增加,就足以大大增加放弃的概率。

我们不得不承认,实现目标效率最高的方式就是等到路径全部清晰之后再去做一个后继者。我们身边不乏这样的人。当看到别人在手里熟练地把弄新玩意时,谦虚地去请教或者暗暗记下来,自己再花一点时间去学习,技艺很快便能达到相近的水平。至于那些探路者绕过的路、碰过的壁,你都不会也不必知晓。

然而,世界上总是有着这么一群看似苦哈哈的碰壁者。他们像是训练参数异常的模型,尽管收益很低,却总是不停地去 explore ,而对 exploit 缺乏兴致。在他们之中,极少的一撮人会真正被人们授予「探路者」的勋章,剩下的大多都会被淹没在岁月长河之中。或许,在他们眼里,这个世界很简单,简单地像一个游乐场。他们没有目的,探索本身就如同玩耍。世界也许就是如此简单,它提供了偌大的游乐场供我们玩耍,数不尽的玩具在等待着我们去探索。


相关链接:


最后修改于 2026-01-14