我用 AI 越用越爽,这件事让我有点害怕
我用 AI 越用越爽,这件事让我有点害怕
清迈,行程已经过半。一个咖啡馆里,我突然想到一个功能。
这种事经常发生——脑子里冒出一个想法,如果当时不记下来,我知道几个小时之后它就没了。我打开手机,点了一下屏幕上的一个按钮,然后开始说。屏幕上,文字一边出现一边对齐成一条新的笔记。说完,我点结束,笔记就保存了。整件事大概用了三十秒。
这是我自己做的一个语音笔记 APP——清迈这一周做完的,行程过一半的时候差不多就能用了,后半程我一直在用它。
它解决了我多年的一个真实需求。开车的时候、走路的时候、洗澡的时候,那些没法掏键盘的瞬间,我总有想法溜走。我之前的办法是用手机自带的备忘录录音,空了再听一遍、转写、整理。能用,但低效。而且我经常拖到忘了再听,等想起来的时候,那条录音已经失去了它原本想留住的东西。
现在我直接说,它就成了一条文字笔记。可搜索、可回看、想听原话还能再听一遍当时的录音。
我每天都在用它。
但我没有把它发出去。
它就在我一个人的手机里。我也没打算很快发。在那之后的几天,我一直在想为什么。

一
我做这个 APP 用的时间不长。
我之前对实时语音转录这件事其实没有什么接触。我知道有这种模型,大概也用过这一类的输入法,但具体到”它是怎么工作的”——它怎么把一段声波变成一个个汉字、它在断句的时候依据是什么、它在嘈杂环境下为什么会突然漏掉一个字——这些我都不知道。
我做的事是这样:我接了一个云厂商的实时语音 API,把它的流式返回接进我的 UI,做了一个能创建、查看、搜索笔记的本地存储。后来我又接了第二家的同类 API,做了一个切换。这样万一某一家服务出问题,我还能用另一家。
听起来像我”懂”语音转录。但我不懂。我懂的是怎么调它的接口、怎么做产品上的取舍、怎么在两个供应商之间做切换。真正”那件事是怎么发生的”——声音变成文字这个过程的内部——我一行代码都没写过,也没想过要写。
而且我之所以能这么快做完,正是因为我不需要懂。云 API 把模型部署、模型选型、性能调优、版本更新——所有真正难的部分——都隔在了一面墙的另一边。我在这面墙的这一边,接根管子过来用,管子里出来什么我用什么。
这件事在五年前是不可想象的。
五年前,一个开发者要做语音转录这件事,他必须懂。他要知道用什么模型、模型怎么部署、怎么处理实时流、怎么处理网络抖动、怎么在端上做降噪。“做出来”和”懂这件事”是同一件事,你不懂就做不出来,做出来意味着你懂了。
现在不是了。做出来和懂这件事,在 AI 时代第一次被拆成了两件事。

二
那篇文章一开始我说,我没把它发出去。
所以——不是因为它不好用,它好用得很。也不是因为它没做完,它已经满足我所有日常需求了。是因为我知道,它在我手里能用,不代表它在别人手里也能用。
我自己用,我清楚它的边界。我知道它在地铁里转录会出错,因为信号差;我知道它对粤语口音支持不太好,因为我自己有时候蹦出几个粤语词它就乱了;我知道我说话太快它会丢字。这些边界对我没问题——出错我就重说一遍,大不了我打字补上。
但要是发出去,用户的边界不是我的边界。一个我从没遇到过的口音、一个我从没在意过的弱网环境、一个我没考虑过的并发量——这些场景下它会怎么表现,我不知道。
而我连”它会在哪里出错”这件事本身都说不清楚。因为那个真正”做这件事”的部分,在那面墙的另一边,不在我手里。
让一个自己都说不清边界的东西去面对真实用户,这是一件不诚实的事。对我自己不诚实,对用户也不诚实。
所以它就停在那儿了。我每天用,它每天为我创造价值。但它过不了那道发布的坎。
三
我害怕的不是 AI 出错——出错我能修,能学习,能补救。
我害怕的是它不出错的时候。
因为它不出错的时候,我会一直以为我懂。我会把”我能用它做出东西”误以为是”我懂这件事”。我会在某个不经意的瞬间——比如有人问我”你这个语音转录怎么实现的”,我开始侃侃而谈”接了云厂商的 API 然后流式处理”——以为我答上来了。但其实我答的是”我用了它”,不是”我懂它”。
这两件事在 AI 出现之前是同一件事。在 AI 出现之后,被拆开了。
而且这件事不只发生在我做这个 APP 的时候。
让我再举几个场景。我每天会让 AI 帮我读文章——一篇英文的技术博客,我没时间一字一字读,我让它给我个总结。我看完总结,关掉。第二天我跟人聊起这篇文章,我能复述它的观点——但我”读过”这篇文章吗?我读的是这篇文章,还是另一个 AI 转述给我的版本?
我让 AI 帮我查一条新闻。它告诉我事情的经过、各方的立场、几个时间节点。我看完,觉得我了解这件事了。但我了解的是事件本身,还是 AI 对这件事的整理?
我让 AI 帮我做一个小工具——一个 Chrome 插件、一个脚本、一个内部的小服务。它跑起来了,解决了我的问题。但这个工具如果有一天出现奇怪的行为,我能 debug 吗?它内部的逻辑我真的看过吗?
每一个场景里,我都得到了我想要的东西。每一个场景里,我都不真的拥有它。
这就是我说的那个气泡。东西在我手里,但东西的内里我看不见。绝大多数时候它没事,我享受着它带给我的便利;但它是一个气泡,它依赖我没去戳它。而我之所以一直没戳破它,不是因为它真的没问题,只是因为没碰到那个会让它破的瞬间。

四
到这里我必须诚实一件事。
我不会因此停止用 AI。
它真的好用。我那个语音笔记 APP,在 AI 之前我做不出来,或者要做很久。我现在每天读的那些技术文章,在 AI 之前我读不完。我现在能跟得上的那些行业动态,在 AI 之前我跟不上。
让我害怕的不是这个气泡的存在,是这个气泡里的生活太舒服了,舒服到我不会主动走出来。
我清楚地知道我活在气泡里。我知道这件事有代价。但我不会回头。
这才是这件事最让人不安的部分。我清醒地选择了一种我自己也知道有问题的状态——因为它的好处太大了,而它的坏处大多数时候不可见。
五
但完全躺平也不是答案。我自己不接受这个答案。
所以这一周我想明白的是这样一件事:至少要知道气泡的边界在哪。
不是要懂全部——AI 时代要”懂全部”已经不现实了。是要知道这个气泡在什么情况下可能会破。
回到我的语音笔记 APP——我自己用,可以;发出去,我不发,因为发出去意味着面对一个我说不清边界的世界。这个”可以 vs 不可以”的分界线,在我心里非常清楚。
回到我读文章——AI 给我的总结我会读,但当我要在某个判断上引用这篇文章的观点时,我会回去读原文。气泡在”快速了解”这一层是稳的,在”基于它做判断”那一层就不一定。
回到我让 AI 帮我做的小工具——给自己用没问题,但只要它要服务我之外的人,我就会逼自己去看一眼它真正在做什么。哪怕只是粗看,至少知道哪里我没看明白。
这些不是什么了不起的方法论。它就是一个开发者在 AI 时代的最低自觉——我不假装我懂我不懂的东西,我也不让我不懂的东西被推到我控制不了的地方去。

六
清迈最后几天,我还在用我那个语音笔记 APP。
它依然好用。它依然没有发布。
这两件事都不会变。
因为我清楚地知道我在气泡里——这个气泡今天没破。
而我能做的最起码的一件事,是不假装它不是。
版权声明
- 作者
- XingKaiXin
- 标题
- 我用 AI 越用越爽,这件事让我有点害怕
- 发布时间
- 2026年4月27日
本作品采用 CC BY-NC-ND 4.0 DEED 许可。