你用 LLM,只拿到了均值
你用 LLM,只拿到了均值
上周让 ChatGPT 写了个 Redis 分布式锁的实现。
代码给出来,看着挺像那么回事——注释有,错误处理有,连日志都帮你写好了。我差点就直接复制进项目了。
后来多看了两眼,发现锁续期的逻辑有 race condition。不是那种一眼 bug,是上线跑两周才会炸的那种。
我当时心想,这东西要是我不懂这块,估计就直接上了。
这就是我现在用 LLM 的感受:它给你的东西,表面看着都正常,但你根本不知道它哪块是虚的。
你拿到的是均值
LLM 这东西,输出就是个概率分布。同一个问题,不同人问,出来的东西能差很多。大部分答案都在中间那块,写得通顺,看着有用,其实就是把网上那些套话平均了一下。
真正好的答案在尾巴上。少,但有。
问题是你怎么知道自己拿到的是中间的还是好的那边?
除非你本来就懂。不然你没法判断。
为什么懂的人更快
这个事挺反直觉的。
LLM 对不同人的帮助其实不一样。你越懂一个东西,它给你加成的幅度越大。因为你能一眼看出它哪不对,然后让它重来——一轮一轮地,把答案从平庸那边往好那边推。
我不知道这该叫什么,反正我自己管这个叫”压榨”。用你已有的东西去压一个概率机器,逼它把它本来能给但懒得给的东西吐出来。
所以人和人用 LLM 的差距,其实就是谁有能力判断好坏,并且能一直压。
我同事前几天让 LLM 写接口文档。出来格式挺漂亮,字段说明全是”此字段用于存储XXX”这种废话。他觉得挺好的,直接提交了。
我自己试的时候,是先想清楚每个字段的边界条件,然后让 LLM 按我这个框架写。出来的东西才能用。
同一个模型,同一个概率空间,差的就是谁能多榨一点出来。
不过说这话得有个前提——你得先把一个东西真的搞懂。这一步谁都省不了。LLM 帮不了你。
还是得往深了走
说实话,LLM 没让知识变平。它是在放大差距。
你给它什么,它给你什么。随便扔个问题过去,出来的东西也就那样。但你先想透了再让它来,效率能差好几倍。
所以我现在觉得,最该干的事还是把某个领域往深了扎。
等你真够深了,它骗不了你。答案差在哪你能说出来,让它重来就是一句话的事,新答案好不好你自己心里也有数。
到那份上,LLM 才真的归你使。