AI热潮第二幕:从GPU短缺到“令牌短缺”的世界

AI热潮第二幕:从GPU短缺到“令牌短缺”的世界

AI需求还没有结束——代币经济吞噬企业、半导体和就业的日子

“AI热潮是否即将达到顶峰?”
在2024年至2025年间,投资者、媒体和企业管理者之间多次重复这个问题。生成AI是暂时的狂热吗?GPU投资是否过剩?企业真的会继续为AI支付费用吗?

然而,NextBigFuture在2026年4月25日发布的文章《AI Demand is Still Booming》描绘的世界与这些疑虑大相径庭。文章认为,AI需求并没有减速,反而需求持续大大超过供应。而且,这种需求不仅仅是聊天机器人使用或话题性。企业实际上在业务中使用AI,让其编写代码、进行调查、自动化分析,开始以少量人力处理过去需要大量人力和时间的工作。

文章的核心是以半导体和AI基础设施分析而闻名的SemiAnalysis的Dylan Patel的发言。NextBigFuture介绍说,SemiAnalysis自身的AI支出从前一年的数万美元规模,急剧增加到目前的年化700万美元规模。重要的是,这些支出不仅限于研究人员和工程师,甚至非技术岗位的员工也日常使用Claude和代码生成AI,改变了业务推进方式。

这是考虑AI需求时极其重要的视角。AI的价值不能仅通过“有多少人免费试用”来衡量。企业在多大程度上将其整合到业务流程中,消耗了多少代币,这种消耗带来了多少收入、成本削减和决策速度提升,才是关键。因此,AI经济的核心指标正在从“用户数量”转向“代币消耗量”和“每代币的经济价值”。

执行变得便宜,创意价值受到考验的时代

NextBigFuture文章中最具刺激性的是“创意便宜,执行困难”这一旧观念正在瓦解的主张。

在过去的商业中,任何人都可以提出创意,但实施、验证、销售和持续改进的执行力才是差异化因素。要制作优秀的产品,需要工程师、设计师、数据分析师、项目经理和销售人员,并且需要时间和资金。

然而,当AI开始编写代码、进行调查、验证假设、制作资料、分析数据时,执行成本迅速下降。当然,人类的判断和质量控制仍然需要,但从“先做出来”“先调查”“先验证”到达成的距离大大缩短。

这种变化对企业家和企业来说是一个巨大的机会。即使是小团队,也可以进行与大企业相当的试错。个人也可以进行以前需要部门级别的分析和开发。NextBigFuture的文章中介绍了使用GPU的芯片分析仪表板和美国电网分析及AI影响基准等在少数人和短时间内实现的例子。

然而,在这个世界中,“做什么”的重要性进一步增加。执行变得容易,平庸的创意很快就会被模仿,并卷入价格竞争。正因为AI可以制作任何东西,能够提出真正有价值问题的人、拥有独特数据或客户接触点的企业、决策快速的组织将占据优势。

在AI时代有价值的不是单纯的工作量,而是良好的问题设定、良好的数据、良好的市场理解,以及将AI输出转化为现实利益的能力。


使用代币的企业与不使用代币的企业的差距

文章提出的另一个强烈论点是,“适度使用AI”可能是不够的。

谈到AI引入,许多企业首先考虑的是成本削减。将原本需要8小时的工作缩短到1小时。减少人员。削减外包费用。这在短期内确实有效。

然而,NextBigFuture的文章强调,仅此是不够的。不是用AI工作1小时就结束,而是用同样的8小时产出8倍、10倍的成果的企业会胜出。也就是说,企业间的差距在于将AI作为“省力工具”还是“爆发生产量的工具”。

这种观点相当严峻。那些不使用AI的人,使用有限的人,吝啬代币消耗的企业,长期来看将处于不利地位。Dylan Patel周围所说的“permanent underclass”这个表达虽然激进,但意思很明确。AI将创造出一个新的差距,价值由充分利用AI的人群产生,而被AI取代的人群则处于不利地位。

当然,这个讨论需要注意。并不是说所有人都应该无限制地使用AI。机密信息、错误信息、版权、安全性、质量保证、成本管理的问题仍然存在。然而,如果企业过度限制AI的使用,现场仍然被旧有的方式束缚,那么在速度上可能会落后于积极利用AI的竞争对手。

AI时代的管理课题已经从“是否使用AI”转变为“在哪些业务中,使用哪个模型,以何种权限使用多少”。


需求爆发背后的半导体瓶颈

随着AI需求的增加,现实世界的限制也开始显现。模型似乎在云端运行,但其背后是GPU、CPU、内存、网络、电力、冷却设备、数据中心、半导体制造设备、先进封装。

NextBigFuture的文章特别指出,在AI基础设施的各个层面,如内存、TSMC、CPU、GPU寿命、光通信、铜箔、PCB、制造设备等,供应紧张正在发生。AI需求不仅仅推高了NVIDIA的GPU。随着AI代理和推理处理的扩展,CPU、DRAM、HBM、存储、网络设备的负担也在扩大。

这是一个重要的变化。早期的AI投资热潮主要被描述为大规模模型训练所需的GPU需求。然而,当AI被整合到实际业务中时,需求的中心将转向推理,即日常使用。企业在代码生成、搜索、分析、客户支持、销售支持、设计、机器人控制等方面使用AI越多,持续的计算资源需求就越大。

而推理需求与单次的大规模训练不同。它每天、每小时、每秒都在发生。用户增加,AI代理开始自主处理任务时,代币消耗将超过人类手动输入的速度。AI调用另一个AI,生成代码,测试,修正,搜索,再次总结。这种代理式工作流程消耗的计算资源远远超过传统的聊天使用。

结果是,半导体供应链受到广泛压力。DRAM和HBM的短缺、先进工艺的生产配额、如CoWoS的先进封装、服务器CPU、数据中心电力、输电网、冷却设备。AI需求不仅是软件产业的问题,同时也是制造业、能源、地缘政治的问题。


Anthropic、Claude Code以及“模型的围堵”

文章还提到了Anthropic的收入增长和Claude Code的使用扩展。NextBigFuture指出,Anthropic的ARR大幅增长,需求强劲,即使调整价格或速率限制也能出售。然而,由于这些数字包含非公开企业的估计和相关人士的发言,不应像官方财报那样对待。

即便如此,作为方向性是容易理解的。AI编码工具对企业来说具有明显的成本效益。代码生成、错误修正、测试创建、迁移工作、内部工具开发等领域,AI的时间缩短直接可测。考虑到工程师的时薪和招聘成本,高性能模型的支出容易被正当化。

这里的问题在于,如何访问最佳模型。如果需求超过供应,AI企业不必以相同条件向所有用户提供最高性能模型。可以优先考虑支付高单价的企业、签订长期合同的企业、战略上重要的客户。

NextBigFuture文章中提到的“model hoarding”描述了这种情况。最高性能模型或大推理配额可能优先分配给有资金实力的企业。如果这样,AI的民主化理想将被颠覆,AI能力将集中于一些大型企业或高收益企业。

这在云时代也曾发生,但在AI时代可能更加严重。因为,AI模型的访问差异直接影响产品开发速度、销售效率、研发能力、客户响应能力,甚至就业结构。

机器人技术可能创造下一波需求

文章还提到了人形机器人和机器人技术。目前的机器人AI在将视觉、语言和行为结合的模型上仍面临数据效率的挑战。然而,如果在少数演示中能够学习任务的突破发生,AI在物理世界的需求可能会迅速扩大。

这一点在考虑AI需求的未来时非常重要。目前大部分AI需求发生在数字空间,如文本、代码、图像、视频、搜索、分析。但如果机器人开始在仓库、工厂、家庭、建筑、医疗、农业、物流中使用,AI将进入物理工作。

物理世界的工作市场规模比数字工作更大。人类手工进行的工作、涉及移动的工作、应对环境变化的工作数量庞大。如果机器人能够通过少数示例学习这些工作,每台机器人在学习、推理、模拟、控制方面将需要大量计算资源。

因此,机器人技术的进展可能成为GPU和代币需求的第二波。在文本AI之后,物理AI将到来。如果这样,AI基础设施需求可能会超出目前的预期。


SNS和评论区的反应:乐观、警惕、中国威胁论

 

对于这篇文章和相关的Dylan Patel的发言,网上的反应并不能简单地分为赞成或反对。总体来看,有三种反应。

首先是投资者和科技界人士的乐观反应。在X平台上,有人表示AI支出不仅是理论上的期望,而是体现在TSMC、ASML、内存企业、数据中心相关企业的订单和前景中。AI需求仍在继续,半导体周期尚未结束,反而扩展到GPU以外的CPU、内存、电力基础设施。这与NextBigFuture的文章立场相近。

其次是劳动者和普通用户的不安。担心AI会夺走工作,企业会因AI投资而裁员,AI数据中心会对地区电力和水资源造成压力。这种担忧很强烈。Pew Research和NBC News相关报道也显示,美国对AI的警惕感在上升。在SNS上,将AI视为“提高生产力的工具”的帖子与视其为“破坏就业和创作的机制”的帖子正面交锋。

第三是围绕与中国竞争的反应。在NextBigFuture的文章评论区,有人评论说,中国模型落后于美国的原因更多在于芯片供应限制,而非技术本身,如果中国在几年内克服这一限制,美国AI企业将在低价竞争中陷入困境。这是将AI竞争视为不仅仅是模型性能的问题,而是半导体供应、国家产业政策、价格竞争力的问题。

这条评论只是一个读者的观点,但包含了重要论点。当前的AI霸权是模型、数据、半导体、云、电力、资本市场的一体化。即使美国企业凭借高性能模型和高价合同领先,如果中国企业通过效率化和低价化追赶,市场结构将发生变化。自DeepSeek以来,低成本高效率模型的影响已经广泛意识到。


AI的反对声浪真的会扩大吗

NextBigFuture的文章还提到,到2026年秋季,可能会发生针对AI企业,特别是Anthropic和OpenAI的大规模抗议。这是一个相当强烈的预测,但背后有舆论的变化。

对AI的不安并不仅仅是对新技术的模糊恐惧。就业、版权、教育、虚假信息、监控、军事用途、数据中心建设、电力消耗等具体争议点在增加。AI企业的高管越是谈论“世界将发生巨大变化”“许多工作将发生变化”,普通人越容易感到不安而非期待。

此外,AI的好处不易被看到也是问题所在。企业通过AI削减成本,投资者享受股价上涨,工程师和管理者感受到生产力提升。而普通消费者可能感受到的是客户支持自动化、内容粗制滥造、就业不安、电费和地区基础设施的担忧。

AI企业要获得社会支持,仅仅谈论“未来会发生很棒的事情”是不够的。需要展示如何在医疗、教育、中小企业支持、行政手续、残疾人支持、研发等方面具体改善当前生活的实例。同时,还必须面对就业转型和再教育、数据使用透明性、与地方的共识形成。

技术越强大,社会责任也越大。


“幻影GDP”这种看不见的生产力

文章中一个有趣的概念是“Phantom GDP”。即使AI实际上增加了生产量或价值,由于成本大幅下降,传统GDP统计中未能充分体现这一点。

例如,过去需要200人花一年时间进行的分析,现在可以由几个人在几周内完成。社会上产生了巨大的价值。然而,如果支付给这项工作的人工费或外包费大幅减少,名义上的经济活动可能看起来在缩小。

这在互联网时代也曾是个问题。免费的搜索、免费的地图、免费的翻译、免费或低价的软件大大提高了生活质量,但GDP难以完全反映其全部价值。AI可能会进一步加剧这一问题。

在企业内部,AI带来的生产力提升是显而易见的。但在宏观统计中,这种价值难以捕捉。结果是,经济指标看似停滞,而实际的知识生产量和决策速度却在急剧上升,这种奇怪的情况可能会发生。

这种“看不见的生产力”使政策决策变得困难。需要改变对就业统计、工资、GDP、企业利润、物价、设备投资的解读方式。


那么,企业和个人应该做些什么

如果AI需求真的会继续扩大,那么企业和个人需要采取的行动是明确的。

企业首先不能将AI使用停留在实验阶段。引入企业内部聊天机器人并不意味着结束,而是需要重新审视在销售、开发、