2025年人工智能现状深度研究报告:代理推理、开源格局重塑与智能经济学
date
Dec 10, 2025
slug
state-of-ai
status
Published
tags
openrouter
ai
summary
2025年标志着人工智能发展史上的一个决定性转折点。根据对OpenRouter平台上超过100万亿token的真实使用数据的详尽实证分析,结合DeepSeek、OpenAI及Air Street Capital等机构的市场情报,我们观察到AI生态系统正在经历从“生成式聊天”向“代理式推理(Agentic Reasoning)”的根本性范式转移。这一年,虽然大模型(LLM)的绝对能力继续攀升,但更深层次的变革发生在用户行为、市场结构以及地缘政治版图中。
本报告旨在为行业专家、决策者及技术构建者提供一份详尽的宏观与微观分析。核心发现表明,市场正在摆脱单一维度的军备竞赛,转向结构性的多元化发展。
首先,推理模型的确立与统治。随着2024年12月OpenAI o1(草莓项目)的全面发布,具备“系统2”思维能力的模型迅速占据了复杂任务的主导地位。数据强有力地证明,在涉及编程、科学计算及复杂逻辑的场景中,推理优化模型已占据超过50%的Token流量。这标志着用户价值取向的重大转变:从追求响应速度转向追求逻辑的正确性与任务的完成度。
其次,开源生态的“东方崛起”。开源模型不再仅仅是闭源模型的低端替代品,而是形成了强大的独立生态。其中,以DeepSeek(深度求索)和Qwen(通义千问)为代表的中国模型异军突起,不仅在性能上逼近甚至超越部分西方顶尖闭源模型,更以极高的资本效率(DeepSeek V3仅以550万美元训练成本对标GPT-4的1亿美元成本)重塑了全球AI的竞争格局。这一现象打破了西方在基础模型层的垄断幻想,推动了全球智能算力的普及。
第三,被忽视的“角色扮演”经济。尽管行业叙事长期聚焦于企业生产力,但实证数据显示,在开源模型的使用中,高达52%的流量流向了创意角色扮演(Roleplay)。这一数据揭示了AI作为“数字伴侣”和“创意媒介”的巨大潜在市场,同时也反映了用户对不受过度安全审查(Uncensored)的自由交互体验的强烈需求,这一需求正由开源社区而非硅谷巨头来满足。
第四,智能经济学的“灰姑娘效应”。虽然模型价格不断下降,但高端市场的需求表现出惊人的价格刚性(Price Inelasticity)。用户忠诚度并非建立在品牌之上,而是建立在“首次成功匹配(First-time Fit)”上。一旦某款模型解决了用户特定的高价值难题,用户便会形成极强的路径依赖,这被称为“灰姑娘效应”。这解释了为何尽管廉价模型层出不穷,昂贵的GPT-4及Claude 3.7 Sonnet依然能维持高额溢价。
本报告将分章节深入剖析上述趋势,结合技术演进、经济模型与地缘政治因素,全面解构2025年的AI全景。
type
Post
1. 执行摘要
2025年标志着人工智能发展史上的一个决定性转折点。根据对OpenRouter平台上超过100万亿token的真实使用数据的详尽实证分析,结合DeepSeek、OpenAI及Air Street Capital等机构的市场情报,我们观察到AI生态系统正在经历从“生成式聊天”向“代理式推理(Agentic Reasoning)”的根本性范式转移。这一年,虽然大模型(LLM)的绝对能力继续攀升,但更深层次的变革发生在用户行为、市场结构以及地缘政治版图中。
本报告旨在为行业专家、决策者及技术构建者提供一份详尽的宏观与微观分析。核心发现表明,市场正在摆脱单一维度的军备竞赛,转向结构性的多元化发展。
首先,推理模型的确立与统治。随着2024年12月OpenAI o1(草莓项目)的全面发布,具备“系统2”思维能力的模型迅速占据了复杂任务的主导地位。数据强有力地证明,在涉及编程、科学计算及复杂逻辑的场景中,推理优化模型已占据超过50%的Token流量。这标志着用户价值取向的重大转变:从追求响应速度转向追求逻辑的正确性与任务的完成度。
其次,开源生态的“东方崛起”。开源模型不再仅仅是闭源模型的低端替代品,而是形成了强大的独立生态。其中,以DeepSeek(深度求索)和Qwen(通义千问)为代表的中国模型异军突起,不仅在性能上逼近甚至超越部分西方顶尖闭源模型,更以极高的资本效率(DeepSeek V3仅以550万美元训练成本对标GPT-4的1亿美元成本)重塑了全球AI的竞争格局。这一现象打破了西方在基础模型层的垄断幻想,推动了全球智能算力的普及。
第三,被忽视的“角色扮演”经济。尽管行业叙事长期聚焦于企业生产力,但实证数据显示,在开源模型的使用中,高达52%的流量流向了创意角色扮演(Roleplay)。这一数据揭示了AI作为“数字伴侣”和“创意媒介”的巨大潜在市场,同时也反映了用户对不受过度安全审查(Uncensored)的自由交互体验的强烈需求,这一需求正由开源社区而非硅谷巨头来满足。
第四,智能经济学的“灰姑娘效应”。虽然模型价格不断下降,但高端市场的需求表现出惊人的价格刚性(Price Inelasticity)。用户忠诚度并非建立在品牌之上,而是建立在“首次成功匹配(First-time Fit)”上。一旦某款模型解决了用户特定的高价值难题,用户便会形成极强的路径依赖,这被称为“灰姑娘效应”。这解释了为何尽管廉价模型层出不穷,昂贵的GPT-4及Claude 3.7 Sonnet依然能维持高额溢价。
本报告将分章节深入剖析上述趋势,结合技术演进、经济模型与地缘政治因素,全面解构2025年的AI全景。
2. 范式转移:从生成式文本到代理推理
2025年最显著的技术与应用特征,是人工智能从概率性的文本生成器(Stochastic Parrots)向具备规划、反思与执行能力的代理(Agents)进化。这一转变不仅是技术架构的升级,更是用户对AI核心价值预期的重构。
2.1 “o1时刻”与系统2思维的觉醒
回顾2024年底,OpenAI于12月5日正式发布的o1模型(及其后续的o3迭代),成为了行业的分水岭。在此之前,以GPT-4为代表的模型主要依赖“系统1”思维——即基于直觉的、快速的单次推理。虽然它们在流畅度上表现优异,但在处理多步骤逻辑时常因“幻觉”而失效。
o1的引入,将“测试时计算(Test-time Compute)”这一概念推向了舞台中央。模型在输出答案前,会花费数秒甚至数分钟进行“思考”,生成隐式的推理链(Chain of Thought),自我验证并纠正逻辑路径。这种模仿人类“系统2”慢思考的机制,从根本上改变了AI处理复杂任务的能力边界。
表 1:2025年主流推理模型能力与定位对比
模型家族 | 代表型号 | 核心架构特征 | 主要应用场景 | 市场定位 |
先行者 (The Pioneers) | OpenAI o1, o1-pro, o3 | 强化学习微调 (RLHF) + 隐式思维链 | 复杂数学证明、算法竞赛、科研推导 | 确立了“思考时间”作为算力资源的价值标准。 |
挑战者 (The Challengers) | Google Gemini 2.5 Pro/Flash | 多模态原生 + 长上下文推理 | 跨模态逻辑分析、超长文档理解 | 凭借Google生态整合,在长文本与视觉推理上占据优势。 |
垂直专家 (The Specialists) | xAI Grok Code Fast 1 | 代码专用微调 + 高频响应 | 实时代码补全、Debug、系统架构设计 | 针对开发者痛点优化,迅速抢占编程市场份额。 |
开源先锋 (The Open Frontier) | DeepSeek R1, Qwen 2.5-Math | 混合专家模型 (MoE) + 蒸馏技术 | 低成本推理、本地化部署、特定领域微调 | 打破推理能力的闭源垄断,实现高性能逻辑的普惠化。 |
从OpenRouter的数据来看,推理模型的普及速度远超预期。在2025年初,此类模型的流量几乎可以忽略不计;但到了年中,在涉及编程和复杂任务的类别中,推理模型的Token消耗占比已突破50%。这一陡峭的采用曲线表明,市场对于“正确性”的渴求远高于对“速度”的依赖。用户宁愿等待模型思考30秒以获得一个可运行的代码块,也不愿在1秒内获得一个充满bug的建议。
2.2 代理式推理:超越对话的新工作流
随着推理能力的提升,“代理式推理(Agentic Inference)”成为了增长最快的行为模式。AI不再仅仅是回答问题的聊天机器人,而是开始扮演执行者的角色。
2.2.1 上下文的爆发式增长
数据通过一个惊人的指标揭示了这一趋势:在过去一年中,每请求的平均输入Token数量增长了近四倍。这一增长并非源于用户变得啰嗦,而是源于“上下文填充(Context Stuffing)”策略的普及。
- 全量信息投喂:在2023年,用户需要费尽心机地通过Prompt Engineering(提示词工程)来精简信息。而在2025年,得益于Gemini 2.5和Claude系列对百万级上下文的支持,用户倾向于直接上传整本技术手册、整个代码库或全套法律案卷。
- 状态保持:更长的上下文意味着模型可以在多轮对话中保持复杂的“状态”。对于一个正在协助构建软件系统的AI代理来说,它需要记住十轮之前的架构决策、五轮之前的API定义以及当前的调试进度。上下文的激增,本质上是AI工作记忆(Working Memory)的扩展,是其能够执行长程任务的物理基础。
2.2.2 工具调用的常态化
另一个关键指标是工具调用(Tool Use)的比例。数据显示,约15%的请求现在包含了对外部API或工具的调用。
- 从大脑到手脚:AI正在从单纯的“大脑”(处理信息)演变为具备“手脚”(执行操作)的中枢。例如,在代码生成场景中,模型不仅编写代码,还会调用解释器运行代码,读取错误信息,修改代码,再运行,直至通过测试。这种“编写-运行-修正”的闭环,正是代理式工作流的核心。
- 生态系统的标准化:随着MCP(Model Context Protocol)等标准的出现 9,连接AI与外部世界的接口正在标准化。这使得开发者可以更容易地将AI集成到现有的企业IT环境中,进一步推动了代理式推理在实际业务中的落地。
2.3 编程垂直领域的矛与盾
在所有应用场景中,软件开发(Coding)无疑是推理模型最激烈的战场。这不仅因为代码是高价值产出,更因为代码具有客观的“真值”——代码要么能运行,要么报错,这为强化学习提供了完美的反馈信号。
Grok的崛起与垂直化趋势:xAI的Grok Code Fast 1在推理流量中的登顶是一个极具象征意义的事件。作为一个后来者,Grok之所以能超越通用的Gemini或GPT模型,在于其极致的垂直化策略。它并非试图在写诗或画图上击败对手,而是专注于“快速、准确地生成代码”。
这揭示了一个更深层的趋势:通用大模型(General Purpose LLMs)的统治地位可能正在动摇,未来属于“专家模型组合”。对于开发者而言,他们不在乎模型是否通过了法学院考试,只在乎它是否精通Rust语言的内存管理。OpenRouter的数据证明,用户正在用脚投票,选择那些在特定垂直领域做到极致的工具。
3. 开源复兴:结构性多元化与“中国冲击”
2025年的AI版图彻底粉碎了“AI将由少数几家美国科技巨头垄断”的预言。相反,我们见证了一个“结构性多元化(Structurally Plural)”生态的诞生,其中最引人注目的变量,来自开源社区,尤其是中国力量的崛起。
3.1 闭源垄断的终结
长期以来,业界普遍认为,训练前沿模型所需的巨额资本支出(CapEx)将构建起不可逾越的护城河,使得顶尖AI技术仅由Google、Microsoft(OpenAI)等巨头掌握。然而,2025年的市场数据显示,虽然闭源模型在超高端推理任务上仍保有优势,但开源模型(Open-Weights)的市场份额已稳步攀升至约三分之一。
更重要的是,开源模型的质量提升速度远超摩尔定律。以Meta的Llama系列为先导,全球各地的实验室迅速跟进,使得“仅落后顶尖模型6个月”的开源模型成为了常态。对于绝大多数商业应用而言,这“6个月的差距”完全可以被开源带来的成本优势、数据隐私可控性以及定制化灵活性所抵消。
3.2 DeepSeek现象:资本效率的奇迹
在开源复兴的浪潮中,中国的DeepSeek(深度求索) 无疑是最耀眼的明星。这家初创公司在不依赖传统风险投资(VC)的情况下,仅凭其母公司量化对冲基金High-Flyer的支持,便实现了对硅谷巨头的技术突围 10。
资本效率的降维打击:DeepSeek V3的发布震惊了全球AI界,不仅因为其性能,更因为其成本。据披露,DeepSeek V3的训练成本仅约为550万美元,而同级别的GPT-4训练成本据估算超过1亿美元。
- 架构创新:这种近20倍的成本优势并非来自偷工减料,而是源于底层架构的创新,特别是对混合专家模型(Mixture-of-Experts, MoE)的极致优化。DeepSeek成功地在保持庞大参数总量的同时,极大幅度地降低了每次推理的激活参数量,从而实现了算力利用率的飞跃。
- 市场影响:DeepSeek的存在直接挑战了西方AI公司的商业模式。如果一家中国公司能以几十分之一的成本开发出SOTA(State of the Art)模型并免费开源,那么OpenAI和Anthropic依靠高昂API定价来回收数百亿训练成本的逻辑将面临严峻考验。这迫使闭源厂商必须不断在推理能力上通过“o1”这样的技术飞跃来维持溢价,否则将陷入价格战的泥潭。
3.3 智能的全球化消费:亚洲的崛起
OpenRouter的地理分布数据进一步印证了AI力量重心的东移。亚洲在全球Token消费中的占比已翻倍,达到约31%。
表 2:DeepSeek 全球用户分布 (2025年1月数据)
国家/地区 | 月活跃用户份额 (MAU Share) | 战略意义 |
中国 | 30.71% | 本土市场的绝对统治力,依托庞大的人口基数进行数据飞轮迭代。 |
印度 | 13.59% | 最大的海外增长点,显示出高性价比模型在发展中国家的巨大吸引力。 |
印度尼西亚 | 6.94% | 东南亚市场的快速渗透。 |
美国 | 4.34% | 尽管面临地缘政治张力,技术社区仍务实地接纳了高效的中国模型。 |
其他 | ~44% | 包括法国、巴西等,显示出全球性的分布特征。 |
数据来源:2
“中国冲击”的地缘政治含义:
中国模型(DeepSeek, Qwen, Yi等)在开源领域的激进策略,形成了一种独特的地缘政治不对称优势。美国依然控制着高端GPU(如Nvidia H100/Blackwell)的硬件供给 11,构成了硬实力的封锁;但中国通过开源软件的软实力输出,实际上正在通过“补贴全球开发者的智能成本”来构建生态依赖。当印度的工程师、巴西的创业者甚至欧洲的研究员都习惯于使用DeepSeek的API格式和Qwen的微调工具时,美国试图通过出口管制来遏制中国AI发展的效果将被部分稀释。这种“硬件封锁 vs 软件突围”的博弈,将是未来数年科技冷战的主旋律。
4. 隐形引擎:角色扮演与情感经济
在OpenAI和Google宏大的企业生产力叙事之外,OpenRouter的数据揭示了一个庞大但常被主流忽视的“暗物质”市场:角色扮演(Roleplay)。
4.1 数据背后的真相:52%的统治力
统计显示,在开源模型的所有使用场景中,超过一半(52%)的流量流向了创意角色扮演。这一比例之高,令人咋舌。当我们谈论“AI改变世界”时,投资者想象的是AI在写代码、做报表、诊断疾病;但现实是,全球数以百万计的用户正在用AI来构建虚拟世界,与虚构的伴侣对话,进行互动式小说创作。
细分数据显示,这52%中大部分属于“游戏/角色扮演游戏(Games/Roleplaying Games)”,以及相当一部分的“成人内容(Adult content)”。这并非边缘现象,而是开源生态的核心驱动力之一。
4.2 安全护栏与人性需求的博弈
为何角色扮演如此集中在开源领域?答案在于“审查(Censorship)”。
- 闭源模型的道德洁癖:ChatGPT(OpenAI)和Claude(Anthropic)在RLHF(人类反馈强化学习)阶段被植入了极强的安全护栏。它们不仅拒绝生成色情暴力内容,甚至对于略带争议的、或是情感过于激烈的对话也持回避态度。这种“保姆式”的监管,虽然满足了企业合规的需求,却扼杀了AI作为“情感伴侣”或“创意缪斯”的可能性。
- 开源模型的自由主义:开源模型(如Llama的某些微调版本、Mistral等)允许用户绕过这些限制。对于寻求沉浸感、情感宣泄或纯粹娱乐的用户而言,一个“会说脏话”、“有脾气”或者“愿意配合任何剧情”的模型,远比一个只会说“作为AI语言模型我不能...”的助手更有价值。
“Her”时刻的预演:
这52%的数据实际上是《Her》(电影《以爱之名》)场景的早期预演。它证明了人类对于“人工智能伴侣”有着巨大的、未被满足的刚需。目前的生产力工具忽视了这一点,但开源社区敏锐地捕捉到了。这预示着,未来AI的一个万亿级赛道可能并非在于“帮人工作”,而在于“陪人生活”。情感计算(Affective Computing)与无审查模型的结合,将催生出全新的娱乐和社交形态。
5. 智能经济学:灰姑娘效应与价格刚性
OpenRouter的研究通过大规模交易数据,为我们勾勒出了一幅反直觉的“智能经济学”图景。在2025年,AI模型并非标准化的“大宗商品(Commodity)”,其市场行为更接近于高度差异化的服务。
5.1 锁定机制:寻找“水晶鞋”
报告提出了“灰姑娘效应(Cinderella Effect)” 这一核心概念,深刻解释了用户留存的心理机制。
- 定义:当用户在面对一个棘手的、从未被解决的高价值任务(如调试一段复杂的并发代码,或撰写一份特定风格的法律文书)时,他们会尝试多个模型。一旦某款模型(“水晶鞋”)成功解决了这个问题,实现了“完美契合”,用户就会产生极强的路径依赖。
- 心理安全感:这种锁定并非基于品牌忠诚度,而是基于对“失败成本”的恐惧。对于专业人士而言,一次AI推理失败带来的不仅是几分钱的Token损失,更是工作流的中断、心流的破坏以及信任的崩塌。因此,一旦找到那个能稳定解决问题的模型,用户几乎不会为了节省成本而切换到其他模型。
- 数据佐证:早期找到“适配模型”的用户群组,其长期留存率远高于那些仍在不断试错的用户。这意味着,AI竞争的关键不在于发布第100个通用模型,而在于谁能率先攻克用户的特定“痛点”。
5.2 价格无弹性与高端市场的防御
基于上述效应,高端模型市场表现出了明显的价格刚性(Price Inelasticity)。
- 需求曲线平缓:数据显示,模型价格每下降10%,使用量仅增加0.5%至0.7%。这是一个极低的价格弹性系数。它表明,对于需要GPT-4或Claude 3.7 Sonnet来处理的关键任务,用户对价格极不敏感。
- 商业启示:这一发现对于OpenAI和Anthropic是巨大的利好。它意味着它们无需陷入与开源模型的“价格战”。只要它们能保持在推理能力上的“代差”,哪怕只是领先5%,它们就能维持高额的溢价。因为对于企业级用户和高端开发者来说,那5%的智力差距就是“可用”与“不可用”的天壤之别。
5.3 市场四象限分析
为了更清晰地理解竞争格局,我们可以将市场模型划分为四个象限 :
表 3:2025年AI模型市场四象限
象限类型 | 典型代表 | 特征描述 | 经济逻辑 |
高效巨人类 (Efficient Giants) | Gemini 1.5/2.0 Flash, DeepSeek V3 | 低价、高量。每百万Token成本低于$0.40。 | 规模经济:作为后台任务(如日志分析、长文档摘要)的默认选项,以极低的利润率换取巨大的吞吐量。 |
高端领袖类 (Premium Leaders) | Claude 3.5/3.7 Sonnet | 高价、高量。价格适中偏高,但性能均衡。 | 品质经济:知识工作者的首选主力工具(Workhorse)。在编程和写作中提供了最佳的“性价比-可靠性”平衡。 |
高端专家类 (Premium Specialists) | OpenAI o1-pro, GPT-4 | 极高价、低量。单次调用成本极高($30+)。 | 保险经济:用于“不容有失”的任务。用户支付高价是为了购买“确定性”和“逻辑深度”。 |
长尾市场类 (Long Tail) | 各类特定微调模型 | 低价、低量。成千上万的小众模型。 | 探索经济:满足极其碎片化的需求(如特定语言、特定游戏风格),虽然单个模型量小,但加总后构成了生态的多样性。 |
这一分类清晰地展示了市场的生态位分化。DeepSeek和Google在争夺“水电煤”的基础设施地位,而OpenAI和Anthropic则在争夺“专家顾问”的高端溢价。
6. 基础设施与算力地缘政治
在软件和模型层面的激烈竞争之下,物理层面的制约因素——算力与能源——依然是决定未来走向的关键变量。Air Street Capital的报告将这一阶段定义为“AI的工业化时代(Industrial Era of AI)” 12。
6.1 算力鸿沟与算法突围
硬件垄断:美国在高端AI芯片领域的统治力依然牢固。Nvidia的H100及Blackwell架构芯片是训练前沿模型的硬通货,且受到严格的出口管制 11。这导致中国及其他受限地区必须在“算力受限”的条件下进行竞争。
算法突围:然而,DeepSeek的案例证明,硬件并非唯一的决定因素。通过使用H800(降频版)集群,配合极致的软件优化和通信库重写,DeepSeek成功绕过了部分硬件瓶颈 13。这表明,算法效率(Algorithmic Efficiency) 正在成为一种能够部分抵消硬件算力(Raw Compute) 差距的战略资源。如果中国实验室能够持续产出更高效率的架构,美国硬件封锁的效果将随时间递减。
6.2 工业化AI与能源瓶颈
随着训练集群向万卡、十万卡级别演进,电力供应正在取代芯片成为新的瓶颈。
- 吉瓦级数据中心:微软与OpenAI规划中的“星际之门(Stargate)”超级计算机,其功耗预计将达到吉瓦(GW)级别,相当于一个中型城市的用电量 12。
- 能源地缘政治:这使得拥有廉价、稳定能源(如中东的太阳能、美国和中国的核能与水电)的国家在未来AI竞争中占据优势。算力竞争正在演变为能源基础设施的竞争。Air Street Capital指出,这一趋势将导致AI发展的“重资产化”,进一步拉大科技巨头与普通研究机构之间的差距,使得顶级AI研究彻底成为“主权级”的博弈 11。
7. 战略启示与未来展望
综上所述,2025年的AI世界是一个充满张力与机遇的复杂系统。
对于模型构建者(Labs):
中间路线已死。未来的生存空间要么在顶端(提供最强的推理能力,如o1),要么在底端(提供最高的性价比,如DeepSeek)。试图做一个“差不多好、价格中等”的模型将面临两面夹击,迅速被市场淘汰。同时,忽视“情感价值”和“角色扮演”需求,意味着将巨大的C端市场拱手让给开源社区。
对于开发者与企业(Users):
停止寻找“万能模型”。未来的应用架构将是“多模型编排(Multi-Model Orchestration)”的。利用廉价的DeepSeek V3处理海量的前置数据清洗和简单交互,利用Grok处理代码生成,最后利用昂贵的o1进行核心逻辑的校验。这种“混合专家路由”将是构建高ROI(投资回报率)应用的关键。
对于投资者与政策制定者:
需要重新评估“护城河”。如果智能本身的边际成本趋向于零(由开源驱动),那么价值将向两端迁移:一端是底层的能源与算力基础设施(Nvidia, 核能公司),另一端是顶层的、具有强用户锁定效应的垂直应用(拥有私有数据和工作流粘性的Agent)。中间的模型层,除非能保持显著的智力代差,否则将面临残酷的商品化竞争。
结论:
2025年不是AI泡沫破裂的一年,而是AI从“魔法”走向“工业”的一年。代理推理赋予了机器思考的能力,开源运动打破了技术的垄断,而市场机制正在无情地筛选出真正具备价值的商业模式。随着“灰姑娘”穿上水晶鞋,AI不仅在重塑我们的生产方式,也在悄然改变我们与数字世界的情感连接。
引用的著作
- State of AI | OpenRouter, 访问时间为 十二月 9, 2025, https://openrouter.ai/state-of-ai
- DeepSeek AI Usage Stats for 2025 - Backlinko, 访问时间为 十二月 9, 2025, https://backlinko.com/deepseek-stats
- DeepSeek Revenue and Usage Statistics (2025) - Business of Apps, 访问时间为 十二月 9, 2025, https://www.businessofapps.com/data/deepseek-statistics/
- Key Insights from OpenRouter's 2025 State of AI report : r/ChatGPT - Reddit, 访问时间为 十二月 9, 2025, https://www.reddit.com/r/ChatGPT/comments/1phbae7/key_insights_from_openrouters_2025_state_of_ai/
- The 100 Trillion Token Mirage: What OpenRouter's AI Report Actually Reveals - Implicator.ai, 访问时间为 十二月 9, 2025, https://www.implicator.ai/the-100-trillion-token-mirage-what-openrouters-ai-report-actually-reveals/
- The Cinderella “Glass Slipper” Effect: Retention Rules in the AI Era | Andreessen Horowitz, 访问时间为 十二月 9, 2025, https://a16z.com/the-cinderella-glass-slipper-effect-retention-rules-in-the-ai-era/
- OpenAI o1 - Wikipedia, 访问时间为 十二月 9, 2025, https://en.wikipedia.org/wiki/OpenAI_o1
- State of AI: An Empirical 100 Trillion Token Study with OpenRouter | Andreessen Horowitz, 访问时间为 十二月 9, 2025, https://a16z.com/state-of-ai/
- OpenRouter Releases AI Usage Status Report with 100 Trillion Tokens - AIBase, 访问时间为 十二月 9, 2025, https://www.aibase.com/news/23410
- 50 Latest DeepSeek Statistics (2025) - Thunderbit, 访问时间为 十二月 9, 2025, https://thunderbit.com/blog/deepseek-ai-statistics
- State of AI 2025: five key charts for Europeans | Science|Business, 访问时间为 十二月 9, 2025, https://sciencebusiness.net/news/ai/state-ai-2025-five-key-charts-europeans
- Welcome to State of AI Report 2025, 访问时间为 十二月 9, 2025, https://www.stateof.ai/2025-report-launch
- DeepSeek AI Statistics 2025: Users & Revenue - DemandSage, 访问时间为 十二月 9, 2025, https://www.demandsage.com/deepseek-statistics/