AI热潮第二幕：从GPU短缺到“令牌短缺”的世界

2026年04月26日 11:10

AI需求还没有结束——代币经济吞噬企业、半导体和就业的日子

“AI热潮是否即将达到顶峰？”
在2024年至2025年间，投资者、媒体和企业管理者之间多次重复这个问题。生成AI是暂时的狂热吗？GPU投资是否过剩？企业真的会继续为AI支付费用吗？

然而，NextBigFuture在2026年4月25日发布的文章《AI Demand is Still Booming》描绘的世界与这些疑虑大相径庭。文章认为，AI需求并没有减速，反而需求持续大大超过供应。而且，这种需求不仅仅是聊天机器人使用或话题性。企业实际上在业务中使用AI，让其编写代码、进行调查、自动化分析，开始以少量人力处理过去需要大量人力和时间的工作。

文章的核心是以半导体和AI基础设施分析而闻名的SemiAnalysis的Dylan Patel的发言。NextBigFuture介绍说，SemiAnalysis自身的AI支出从前一年的数万美元规模，急剧增加到目前的年化700万美元规模。重要的是，这些支出不仅限于研究人员和工程师，甚至非技术岗位的员工也日常使用Claude和代码生成AI，改变了业务推进方式。

这是考虑AI需求时极其重要的视角。AI的价值不能仅通过“有多少人免费试用”来衡量。企业在多大程度上将其整合到业务流程中，消耗了多少代币，这种消耗带来了多少收入、成本削减和决策速度提升，才是关键。因此，AI经济的核心指标正在从“用户数量”转向“代币消耗量”和“每代币的经济价值”。

执行变得便宜，创意价值受到考验的时代

NextBigFuture文章中最具刺激性的是“创意便宜，执行困难”这一旧观念正在瓦解的主张。

在过去的商业中，任何人都可以提出创意，但实施、验证、销售和持续改进的执行力才是差异化因素。要制作优秀的产品，需要工程师、设计师、数据分析师、项目经理和销售人员，并且需要时间和资金。

然而，当AI开始编写代码、进行调查、验证假设、制作资料、分析数据时，执行成本迅速下降。当然，人类的判断和质量控制仍然需要，但从“先做出来”“先调查”“先验证”到达成的距离大大缩短。

这种变化对企业家和企业来说是一个巨大的机会。即使是小团队，也可以进行与大企业相当的试错。个人也可以进行以前需要部门级别的分析和开发。NextBigFuture的文章中介绍了使用GPU的芯片分析仪表板和美国电网分析及AI影响基准等在少数人和短时间内实现的例子。

然而，在这个世界中，“做什么”的重要性进一步增加。执行变得容易，平庸的创意很快就会被模仿，并卷入价格竞争。正因为AI可以制作任何东西，能够提出真正有价值问题的人、拥有独特数据或客户接触点的企业、决策快速的组织将占据优势。

在AI时代有价值的不是单纯的工作量，而是良好的问题设定、良好的数据、良好的市场理解，以及将AI输出转化为现实利益的能力。

使用代币的企业与不使用代币的企业的差距

文章提出的另一个强烈论点是，“适度使用AI”可能是不够的。

谈到AI引入，许多企业首先考虑的是成本削减。将原本需要8小时的工作缩短到1小时。减少人员。削减外包费用。这在短期内确实有效。

然而，NextBigFuture的文章强调，仅此是不够的。不是用AI工作1小时就结束，而是用同样的8小时产出8倍、10倍的成果的企业会胜出。也就是说，企业间的差距在于将AI作为“省力工具”还是“爆发生产量的工具”。

这种观点相当严峻。那些不使用AI的人，使用有限的人，吝啬代币消耗的企业，长期来看将处于不利地位。Dylan Patel周围所说的“permanent underclass”这个表达虽然激进，但意思很明确。AI将创造出一个新的差距，价值由充分利用AI的人群产生，而被AI取代的人群则处于不利地位。

当然，这个讨论需要注意。并不是说所有人都应该无限制地使用AI。机密信息、错误信息、版权、安全性、质量保证、成本管理的问题仍然存在。然而，如果企业过度限制AI的使用，现场仍然被旧有的方式束缚，那么在速度上可能会落后于积极利用AI的竞争对手。

AI时代的管理课题已经从“是否使用AI”转变为“在哪些业务中，使用哪个模型，以何种权限使用多少”。

需求爆发背后的半导体瓶颈

随着AI需求的增加，现实世界的限制也开始显现。模型似乎在云端运行，但其背后是GPU、CPU、内存、网络、电力、冷却设备、数据中心、半导体制造设备、先进封装。

NextBigFuture的文章特别指出，在AI基础设施的各个层面，如内存、TSMC、CPU、GPU寿命、光通信、铜箔、PCB、制造设备等，供应紧张正在发生。AI需求不仅仅推高了NVIDIA的GPU。随着AI代理和推理处理的扩展，CPU、DRAM、HBM、存储、网络设备的负担也在扩大。

这是一个重要的变化。早期的AI投资热潮主要被描述为大规模模型训练所需的GPU需求。然而，当AI被整合到实际业务中时，需求的中心将转向推理，即日常使用。企业在代码生成、搜索、分析、客户支持、销售支持、设计、机器人控制等方面使用AI越多，持续的计算资源需求就越大。

而推理需求与单次的大规模训练不同。它每天、每小时、每秒都在发生。用户增加，AI代理开始自主处理任务时，代币消耗将超过人类手动输入的速度。AI调用另一个AI，生成代码，测试，修正，搜索，再次总结。这种代理式工作流程消耗的计算资源远远超过传统的聊天使用。

结果是，半导体供应链受到广泛压力。DRAM和HBM的短缺、先进工艺的生产配额、如CoWoS的先进封装、服务器CPU、数据中心电力、输电网、冷却设备。AI需求不仅是软件产业的问题，同时也是制造业、能源、地缘政治的问题。

Anthropic、Claude Code以及“模型的围堵”

文章还提到了Anthropic的收入增长和Claude Code的使用扩展。NextBigFuture指出，Anthropic的ARR大幅增长，需求强劲，即使调整价格或速率限制也能出售。然而，由于这些数字包含非公开企业的估计和相关人士的发言，不应像官方财报那样对待。

即便如此，作为方向性是容易理解的。AI编码工具对企业来说具有明显的成本效益。代码生成、错误修正、测试创建、迁移工作、内部工具开发等领域，AI的时间缩短直接可测。考虑到工程师的时薪和招聘成本，高性能模型的支出容易被正当化。

这里的问题在于，如何访问最佳模型。如果需求超过供应，AI企业不必以相同条件向所有用户提供最高性能模型。可以优先考虑支付高单价的企业、签订长期合同的企业、战略上重要的客户。

NextBigFuture文章中提到的“model hoarding”描述了这种情况。最高性能模型或大推理配额可能优先分配给有资金实力的企业。如果这样，AI的民主化理想将被颠覆，AI能力将集中于一些大型企业或高收益企业。

这在云时代也曾发生，但在AI时代可能更加严重。因为，AI模型的访问差异直接影响产品开发速度、销售效率、研发能力、客户响应能力，甚至就业结构。

机器人技术可能创造下一波需求

文章还提到了人形机器人和机器人技术。目前的机器人AI在将视觉、语言和行为结合的模型上仍面临数据效率的挑战。然而，如果在少数演示中能够学习任务的突破发生，AI在物理世界的需求可能会迅速扩大。

这一点在考虑AI需求的未来时非常重要。目前大部分AI需求发生在数字空间，如文本、代码、图像、视频、搜索、分析。但如果机器人开始在仓库、工厂、家庭、建筑、医疗、农业、物流中使用，AI将进入物理工作。

物理世界的工作市场规模比数字工作更大。人类手工进行的工作、涉及移动的工作、应对环境变化的工作数量庞大。如果机器人能够通过少数示例学习这些工作，每台机器人在学习、推理、模拟、控制方面将需要大量计算资源。

因此，机器人技术的进展可能成为GPU和代币需求的第二波。在文本AI之后，物理AI将到来。如果这样，AI基础设施需求可能会超出目前的预期。

SNS和评论区的反应：乐观、警惕、中国威胁论

对于这篇文章和相关的Dylan Patel的发言，网上的反应并不能简单地分为赞成或反对。总体来看，有三种反应。

首先是投资者和科技界人士的乐观反应。在X平台上，有人表示AI支出不仅是理论上的期望，而是体现在TSMC、ASML、内存企业、数据中心相关企业的订单和前景中。AI需求仍在继续，半导体周期尚未结束，反而扩展到GPU以外的CPU、内存、电力基础设施。这与NextBigFuture的文章立场相近。

其次是劳动者和普通用户的不安。担心AI会夺走工作，企业会因AI投资而裁员，AI数据中心会对地区电力和水资源造成压力。这种担忧很强烈。Pew Research和NBC News相关报道也显示，美国对AI的警惕感在上升。在SNS上，将AI视为“提高生产力的工具”的帖子与视其为“破坏就业和创作的机制”的帖子正面交锋。

第三是围绕与中国竞争的反应。在NextBigFuture的文章评论区，有人评论说，中国模型落后于美国的原因更多在于芯片供应限制，而非技术本身，如果中国在几年内克服这一限制，美国AI企业将在低价竞争中陷入困境。这是将AI竞争视为不仅仅是模型性能的问题，而是半导体供应、国家产业政策、价格竞争力的问题。

这条评论只是一个读者的观点，但包含了重要论点。当前的AI霸权是模型、数据、半导体、云、电力、资本市场的一体化。即使美国企业凭借高性能模型和高价合同领先，如果中国企业通过效率化和低价化追赶，市场结构将发生变化。自DeepSeek以来，低成本高效率模型的影响已经广泛意识到。

AI的反对声浪真的会扩大吗

NextBigFuture的文章还提到，到2026年秋季，可能会发生针对AI企业，特别是Anthropic和OpenAI的大规模抗议。这是一个相当强烈的预测，但背后有舆论的变化。

对AI的不安并不仅仅是对新技术的模糊恐惧。就业、版权、教育、虚假信息、监控、军事用途、数据中心建设、电力消耗等具体争议点在增加。AI企业的高管越是谈论“世界将发生巨大变化”“许多工作将发生变化”，普通人越容易感到不安而非期待。

此外，AI的好处不易被看到也是问题所在。企业通过AI削减成本，投资者享受股价上涨，工程师和管理者感受到生产力提升。而普通消费者可能感受到的是客户支持自动化、内容粗制滥造、就业不安、电费和地区基础设施的担忧。

AI企业要获得社会支持，仅仅谈论“未来会发生很棒的事情”是不够的。需要展示如何在医疗、教育、中小企业支持、行政手续、残疾人支持、研发等方面具体改善当前生活的实例。同时，还必须面对就业转型和再教育、数据使用透明性、与地方的共识形成。

技术越强大，社会责任也越大。

“幻影GDP”这种看不见的生产力

文章中一个有趣的概念是“Phantom GDP”。即使AI实际上增加了生产量或价值，由于成本大幅下降，传统GDP统计中未能充分体现这一点。

例如，过去需要200人花一年时间进行的分析，现在可以由几个人在几周内完成。社会上产生了巨大的价值。然而，如果支付给这项工作的人工费或外包费大幅减少，名义上的经济活动可能看起来在缩小。

这在互联网时代也曾是个问题。免费的搜索、免费的地图、免费的翻译、免费或低价的软件大大提高了生活质量，但GDP难以完全反映其全部价值。AI可能会进一步加剧这一问题。

在企业内部，AI带来的生产力提升是显而易见的。但在宏观统计中，这种价值难以捕捉。结果是，经济指标看似停滞，而实际的知识生产量和决策速度却在急剧上升，这种奇怪的情况可能会发生。

这种“看不见的生产力”使政策决策变得困难。需要改变对就业统计、工资、GDP、企业利润、物价、设备投资的解读方式。

那么，企业和个人应该做些什么

如果AI需求真的会继续扩大，那么企业和个人需要采取的行动是明确的。

企业首先不能将AI使用停留在实验阶段。引入企业内部聊天机器人并不意味着结束，而是需要重新审视在销售、开发、

AI热潮第二幕：从GPU短缺到“令牌短缺”的世界

AI需求还没有结束——代币经济吞噬企业、半导体和就业的日子

执行变得便宜，创意价值受到考验的时代

使用代币的企业与不使用代币的企业的差距

需求爆发背后的半导体瓶颈

Anthropic、Claude Code以及“模型的围堵”

机器人技术可能创造下一波需求

SNS和评论区的反应：乐观、警惕、中国威胁论

AI的反对声浪真的会扩大吗

“幻影GDP”这种看不见的生产力

那么，企业和个人应该做些什么

即使是谷歌也难以跟上 ─ AI时代的安全性已成为“以秒为单位”的战斗

一个人实现年营业额1亿日元的规模 AI时代的新创业模式在中国启动

人类能否继续掌握AI的控制权？Anthropic警告的核心

“99％的CEO确信AI裁员”所展示的反乌托邦：在效率化的背后崩溃的年轻人职业生涯与共生的谎言

被AI夺走的80%，人类仅掌握的最后20%

cookie_banner_title

AI需求还没有结束——代币经济吞噬企业、半导体和就业的日子

执行变得便宜，创意价值受到考验的时代

使用代币的企业与不使用代币的企业的差距

需求爆发背后的半导体瓶颈

Anthropic、Claude Code以及“模型的围堵”

机器人技术可能创造下一波需求

SNS和评论区的反应：乐观、警惕、中国威胁论

AI的反对声浪真的会扩大吗

“幻影GDP”这种看不见的生产力

那么，企业和个人应该做些什么

即使是谷歌也难以跟上 ─ AI时代的安全性已成为“以秒为单位”的战斗

一个人实现年营业额1亿日元的规模 AI时代的新创业模式在中国启动

人类能否继续掌握AI的控制权？Anthropic警告的核心

“99％的CEO确信AI裁员”所展示的反乌托邦：在效率化的背后崩溃的年轻人职业生涯与共生的谎言

被AI夺走的80%，人类仅掌握的最后20%