别再叫「蒸馏」了——你写的就是一张角色卡
别再叫「蒸馏」了——你写的就是一张角色卡
最近 GitHub 上「蒸馏」这个词快被用烂了。
同事.skill,前任.skill,张雪峰.skill,自己.skill,甚至还有女娲.skill——号称能蒸馏任何人。短短几天,同事.skill 冲到了上万 Star,各种衍生项目像雨后春笋一样冒出来。小红书、微博、抖音全在刷,央广网都下场报道了。
作为一个天天跟大模型打交道的工程师,我看到「人格蒸馏」这四个字,第一反应不是兴奋,是别扭。这个词从技术上讲用错了,而且错得很离谱。
真正的蒸馏长什么样

知识蒸馏(Knowledge Distillation)是 2015 年 Hinton 提出的一种模型训练技术。核心思路很朴素:大模型能力强但太重,能不能把它的「知识」压缩进一个小模型里?
具体怎么做?让大模型(老师)和小模型(学生)看同样的题目。老师不只是告诉学生「答案是猫」,而是把自己的整个判断过程——「猫 90%、狗 8%、虎 2%」这个概率分布——传给学生。学生根据老师的分布去调整自己的模型权重,反复训练,直到它的判断逻辑接近老师。
这里面有几个关键词:训练过程、梯度下降、权重更新。蒸馏结束后,学生模型的内部参数发生了永久性的改变。它不需要老师在旁边提醒,自己就能做出接近老师水准的判断。
今年 Anthropic 公开指控 DeepSeek 等公司对 Claude 进行大规模蒸馏——1600 万次对话交互,提取 Claude 的推理路径,再用来训练自己的模型。这才是蒸馏。它改变的是模型本身。当然对于这个指控,Anthropic 并没有给出任何实际证据。
记住这个判断标准:蒸馏的产物是一个被改变了权重的新模型。
所谓「人格蒸馏」在做什么

现在回头看看 GitHub 上那些火得一塌糊涂的项目,它们的实际操作流程是什么?
第一步,收集一个人的文本数据——聊天记录、文章、演讲稿、社交媒体发言。第二步,让大模型阅读这些数据,提取说话风格、常用词汇、性格特征、决策习惯。第三步,把提取出来的特征整理成一份结构化的描述文档。
最终产出的东西是什么?一段系统提示词。一个 Markdown 文件。一张角色卡。
整个过程中,没有任何模型被训练过。没有梯度下降,没有权重更新,没有任何一个模型的内部参数因为这个操作发生了改变。底座模型还是那个底座模型——Claude 还是 Claude,GPT 还是 GPT。你只是在对话开始前,往它的上下文窗口里塞了一段人物描述。
如果这叫蒸馏,那每个写过「你现在是一个资深 Python 工程师,说话风格简洁直接」的人,都可以说自己在做蒸馏。说白了,整个过程就是摘要,产出的是一张角色卡,不是一个新模型。
这不是咬文嚼字

你可能会觉得我在抠字眼——叫什么不重要,好用就行。
但命名确实很重要。因为「蒸馏」这个词自带一层技术暗示:它让你觉得发生了某种不可逆的能力迁移,觉得一个人的「精华」被真正地提纯、固化到了 AI 里面。可这张角色卡的效果,百分之百取决于三件事:底座模型的能力、上下文窗口的大小、以及你喂进去的原始数据质量。同一张卡,放在不同模型上,表现天差地别。换个模型版本,上个月还像模像样的输出,这个月可能就面目全非了。
而且这张卡的信息密度有硬上限——再复杂的人格描述,也得挤进上下文窗口里。一个人几十年的经历、成千上万次的决策、无数个塑造了他性格的微小瞬间,被压缩成几千个 token 的摘要。这不是提纯,是有损压缩,损失的那些恰恰是最难被文本记录的部分。
写过小说的人都知道,角色卡写得再详细,笔下的人物也不等于真人。AI 的角色卡也一样——它能模仿一个人说话的格式,但模仿不了那个人之所以那样说话的全部原因。
角色卡不丢人,偷换概念才丢人
我对角色卡本身没有任何意见。
提示词工程中的角色设定,从 2022 年 ChatGPT 发布以来就是最基础、最广泛的用法之一。给 AI 一个角色去扮演,让它的输出更贴合你的需求——这是完全合理的使用方式。把这个过程自动化,用 AI 从原始数据中提取人物特征再生成角色卡,也是一个有价值的工程实践。
但请叫它「角色卡生成」或者「人物画像提取」,不要叫它「蒸馏」。
叫它蒸馏,就是在借一个有明确技术定义的术语来制造虚假的高级感。它让不了解技术的人以为这背后有某种深奥的 AI 训练过程,让 GitHub 上堆满了靠一个唬人名字收割 Star 的低质量仓库。有些项目蒸馏名人,参考数据只有两篇演讲和几条语录,你可以想象那张角色卡的质量。
更让我不舒服的是「数字永生」这类说法。把角色卡包装成「复活」或「永生」,对已故的人是消费,对活着的人是误导。你没有复活任何人,你只是让一个大语言模型穿上了一件根据有限资料裁剪出来的戏服。它可以演得像,但它不是那个人。它甚至不知道自己在演谁。
概念偷换不是无害的小事。在一个大多数人还在建立对 AI 基础认知的阶段,每一个被滥用的术语,都在拉高公众预期和现实能力之间的落差。
所以,下次当你看到有人说「我蒸馏了某某」,请在心里默默翻译一下:
他写了一张角色卡。
仅此而已。
版权声明
- 作者
- XingKaiXin
- 标题
- 别再叫「蒸馏」了——你写的就是一张角色卡
- 发布时间
- 2026年4月14日
本作品采用 CC BY-NC-ND 4.0 DEED 许可。