H200一夜涨了30%H100全球断货连Karpathy这种顶配资源的研究者都在抱怨配额不够。与此同时微软内部发现烧Token的成本已经超过了直接雇人写代码——两个信号叠在一起指向同一个结论AI的便宜时代快要结束了。 这不是涨价是信号2026年5月硅谷最焦虑的不是AI能不能做到而是用不用得起。H200一夜涨了30%。这不是市场波动是供需撕裂。H100早在几个月前就已经全球断货云厂商的配额制让大部分人连排队的机会都没有。但真正值得关注的不是H200涨了多少而是连Karpathy在抱怨配额不够。当圈子里最有资源的人都在喊缺说明供给端的结构性问题已经不只是紧张而是系统性危机。这事得放到更大的背景下来看。英伟达的产能不是说扩就扩的。台积电CoWoS封装产能的扩充周期在12-18个月即便是最乐观的预测2026年下半年之前也看不到有效缓解。与此同时每一波大模型升级都在消耗更多的算力——GPT-5的训练成本据传是GPT-4的10倍以上推理阶段的算力需求更是指数级增长。供给和需求之间的剪刀差正在加速拉开。⚙️ 微软的数据比Karpathy的抱怨更可怕Karpathy抢不到卡是个体困境微软的数据才是系统级警报。微软内部做了一件事——把Token成本拆到每个工程师头上。算完发现一个让他们睡不着觉的数字烧Token的成本已经超过了直接雇人写代码的薪资。这个数据直接导致微软悄悄踩了vibe coding的刹车。不是不做了是要重新算投入产出比。Copilot创始工程师Neel Sundaresan更是辛辣大多数AI编码就像开着法拉利去买牛奶。能力强但用错了地方效率反而更低。这两件事放在一起说明一个道理当行业巨头都在喊贵的时候就不是小公司的问题了——是这个行业的商业模式有问题。️ 成本结构正在决定技术路线GPU短缺和Token涨价正在倒逼整个行业做出选择。第一条路硬扛成本。继续烧钱等供给端跟上。但问题是没有人知道什么时候才能跟上。2025年大家都在赌明年会缓解2026年大家发现明年会更糟。第二条路优化效率。这其实已经在发生了。ClickHouse团队用了一年AI编码后总结出了非常诚实的经验——哪些任务适合用AI哪些不适合。核心结论是不要为了用AI而用AI找到对的场景比堆Token重要得多。第三条路改变范式。Anthropic推出MCP隧道让私有Agent可以安全访问企业内网本质上是在降低Agent落地的门槛。门槛降低了Token的使用效率就能提高。这条路是最有前景的但也最难——需要整个基础设施层的大改造。从Grab的实践案例来看他们已经开始这么做了。中央数据团队搭建了多智能体系统把自动化工作分成两类自动执行的和需要人工确认的。这种分层设计本质上就是在成本可控的范围内最大化AI的价值。✅ 谁在赚谁在亏谁在亏盲目堆算力的创业公司——最容易被成本压垮依赖单一云厂商GPU的团队——涨价毫无议价权不做成本核算的AI研究者——资源配额随时可能被砍谁在赚算力优化赛道——DeepSeek的量化和蒸馏路线估值暴涨AI基础设施监控——Agent越来越多谁来监控它们成了新机会Node-based MCP和Agent编排——降低使用成本就是创造价值 写在最后2026年5月的硅谷AI行业正站在一个十字路口一边是继续烧钱等供给缓解一边是逼着自己把每一分Token都用在刀刃上。这个选择无关对错只关乎你想活多久。对于团队来说现在最该做的不是追AI能力的上限而是算清楚自己的成本底线。ClickHouse团队说得好AI是个好工具但用对场景的人才能活到下个周期。觉得有启发点个在看关注我不错过AI行业的真信号参考资料[1] 硅谷深陷算力荒H200一夜涨价30%H100抢到缺货Karpathy也未能幸免: https://mp.weixin.qq.com/s?__bizMjM5MDE0Mjc4MAmid2651285214idx1sn2a56c4c18ce8de4a44d10a4b9b0ca2bb[2] 微软按下 vibe coding 暂停键烧 token 已经比员工贵了: https://mp.weixin.qq.com/s?__bizMTMwNDMwODQ0MQmid2653107181idx1sn58fc8abc6447f864db5b2675f085910b[3] What ClickHouse learned from a year of coding with AI agents: https://thenewstack.io/clickhouse-ai-coding-agents/[4] Copilot 创始工程师大多数 AI 编码就像开着法拉利去买牛奶: https://mp.weixin.qq.com/s?__bizMjM5MDE0Mjc4MAmid2651285633idx2sna79ef03e7c871dfdff0e8093d9fe9504[5] Anthropic 推出 MCP 隧道供私有代理访问内部系统: https://mp.weixin.qq.com/s?__bizMjM5MDE0Mjc4MAmid2651285633idx4sn8d615360a54bf818f7a3b4ff4f426110[6] 大规模工程支撑场景下的多智能体系统设计Grab 实践案例: https://mp.weixin.qq.com/s?__bizMjM5MDE0Mjc4MAmid2651285633idx3sn97076f465c8b7eb3be988b414327cadd[7] Who’s monitoring the agents?: https://thenewstack.io/who-monitors-ai-agents/