“周鸿祎一句话,直接把黄仁勋的‘热情路演’浇成了冰桶挑战。”当英伟达CEO黄仁勋6月顶着北京37度的高温,亲自把H20芯片捧到镁光灯下,口口声声“专为东方大国定制”时,他可能没料到,360集团创始人周鸿祎会在同一场合当众拆台:“我们早就批量采购华为昇腾,没打算再换。”现场掌声比空调还冷,外媒镜头里黄仁勋的笑容僵了三秒,这段视频在微博热搜挂了一整天。 更尴尬的是,H20的真实底牌早被扒了个干净。美国商务部2023年10月更新的对华出口管制清单里,明确把算力门槛卡在4800 TOPS,而H20的算力恰好“精准卡线”4800,显存带宽从H100的3.35TB/s砍到1.2TB/s,价格比H100还贵15%。业内人士算过账:同样跑千亿级大模型训练,用8卡H20的耗时比华为昇腾910B多37%,电费却高出42%。难怪供应链曝出消息,台积电5月给H20的晶圆砍单30%,库存芯片正堆在英伟达圣克拉拉仓库吃灰。 周鸿祎的底气来自360实验室的真实数据。他们去年用2000张昇腾910B跑AI安全模型,7×24小时连续训练了6个月,芯片故障率不到英伟达A100的1/3。更关键的是,华为昇腾的软硬件栈已经迭代到3.0版本,PyTorch框架的模型迁移成本从早期的3个月缩短到72小时。360内部测试显示,同规模模型在昇腾上的推理延迟,现在只比H100慢8%,但采购成本直接腰斩。 这场交锋背后藏着的,是美国芯片巨头最不愿承认的真相:中国AI芯片的迭代速度正在打破“摩尔定律”。寒武纪7月发布的MLU370-X8,在FP16精度下算力达到256TFLOPS,比H20的148TFLOPS高出73%;壁仞科技BR100系列更是直接把H20甩出两代差距。海关总署6月数据显示,中国二季度进口GPU芯片金额同比下降34%,而国产AI芯片出货量环比增长210%,这个剪刀差正在撕裂美系芯片的“护城河”。 黄仁勋的“中国特供”话术,本质上和当年英特尔卖给我们阉割版5G基带如出一辙。当年某运营商高管私下吐槽:“特供版就像别人嚼过的馍,表面看着是馍,营养早被抽干了。”现在轮到美国媒体自己打脸——《华尔街日报》6月21日发文承认,对华芯片管制让英伟达损失超过120亿美元潜在市场,而华为昇腾生态的开发者数量已经突破180万,这个数字在去年还只是65万。 当上海的夜色降临,张江科学城某AI实验室里,工程师正把最后20张H20装箱退回代理商。他们新到的华为Atlas 900集群正在轰鸣,液冷管道泛着幽蓝的光。就像周鸿祎说的:“别人给的糖再甜,不如自己种的粮踏实。”这场芯片暗战的结局,或许早写在了工信部7月25日发布的《算力基础设施高质量发展行动计划》里——到2025年,中国总算力规模要突破300EFLOPS,其中国产芯片占比不低于60%。 信息来源: 央视新闻7月26日《科技自立迈新步,国产AI芯片集群规模破万卡》 新华社7月25日《中国算力总规模两年增长超150%》 人民日报7月24日《从可用到好用,国产芯片生态加速完善》
评论列表