Communications, Computing

The United States has canceled the 30-day exemption period美国加码取消30天豁免期,英伟达A800/H800芯片价格飙涨

In August last year, a ban on Nvidia’s chip export to China sent the country’s budding artificial intelligence startups scrambling for alternatives. A momentary sense of relief came when Nvidia unveiled chips with reduced performance to bypass export restrictions. But this respite was short-lived.

On Tuesday, the Biden administration announced a slew of measures to curb Beijing’s military ambitions, including a further restriction on Nvidia’s AI chip shipments to China. A800 and H800, the two AI chips Nvidia designed specifically to continue shipping to China, will be hit by the fresh round of new rules.

The chip bans are originally targeted at China’s military use, but the more visible victims are arguably the country’s raft of startups riding the rapid advancement of large language models. Many of them rushed to stockpile Nvidia’s A100 and H100 before the bans went into effect, shelling out millions of dollars for the inflated costs. Alibaba, Baidu, ByteDance and Tencent collectively ordered $5 billion of A800 chips this year and the next, according to a report from the Financial Times.

Nascent startups, meanwhile, are driven to raise venture capital hastily to support their costly AI dreams.

An Nvidia spokesperson said given the demand worldwide for the firm’s products, we don’t expect a near-term meaningful impact on our financial results.”

“We comply with all applicable regulations while working to provide products that support thousands of applications across many different industries,” the spokesperson said.

The U.S. chip bans have not stopped Chinese giants from pursuing their AI ambitions. On Tuesday, Baidu unveiled the latest version of its flagship foundation model, Ernie 4.0, and claimed that it now matches GPT4. To date, Ernie has amassed 45 million users, the company claimed.

The challenge of entering China’s AI fray goes beyond increasingly limited semiconductor access. The country’s regulations require that LLM-based services obtain a license before serving public users, a test of companies’ government relations and their ability to navigate the red tape.

Ultimately, a shortage of high-end chips and the intricate nature of Beijing’s censorship requirements created an environment for generative business intelligence services to flourish, as they require less computational power (data sources are internal rather than the entire internet) and are comparatively easier to control as prompts are more scenario-based. Qianfan, Baidu’s enterprise-facing AI platform built on Ernie, has amassed some 17,000 customers.

美国时间10月17日,美国商务部下属工业安全局(BIS)发布一系列新的管制文件,扩大对华出口先进芯片的管制范围,公告共计近500页。

其中,美国出口管制新规不仅直接阻断美国芯片巨头英伟达、英特尔等生产的“特供版”芯片卖到中国及40余个国家,而且更新半导体设备和技术相关的“长臂管辖”,扩大荷兰光刻机企业ASML(阿斯麦)不可对华出口机型范围,且限制波及中国之外20余个国家。此外,BIS还将壁仞、摩尔线程等13个中国实体加入美国管制清单,直接影响 AI 芯片生产销售。

对此,英伟达向SEC发布的公告文件中表示,根据美国政府实施的额外许可要求,超过特定性能阈值的产品出口到包括中国在内的特定国家需要获得许可,这些产品包括但不限于A100、A800、H100、H800、L40、L40S,以及RTX4090等。公司称,这可能会影响公司按时完成产品开发,对受限产品现有客户的支持,以及对受限地区之外客户供应受限产品的能力。

同时,英伟达还表示,新规还可能要求公司将部分运营迁出受影响区域——换句话说,英伟达不再向中国市场销售。而若客户需要采购受美国政府新规影响的产品,公司可能会为其申请许可,但无法保证最终能否通过审批。

同日,英伟达发言人表示,将遵守所有适用的法规,同时努力提供支持多个行业数千种应用的产品,鉴于全球市场对公司产品的需求,预计短期内财务业绩不会产生实质性影响。

A800、H800是英伟达向中国市场销售的最先进两款 AI 芯片,包括A100/A800、H100/H800在内的多款产品,是如今数据中心、人工智能领域最主流的产品,是当前大范围用于国内 AI 大模型的重要“入场券”、模型训练的唯一芯片产品。

目前,英伟达占据全球数据中心 AI 加速市场82%的份额,而且以95%的市场占有率垄断了全球 Al 训练领域的市场,成为这轮 AI 混战中最大赢家。而黄仁勋和他的英伟达公司赚的盆满钵满,市值已超越1万亿美元。

从技术角度来说,A100峰值算力超过4800TOPS(每秒钟可进行4800万亿次运算)、带宽达到600GB/s,H100性能较A100更高。早在去年10月7日,BIS发布一套对华出口管制政策规定,长达139页,对芯片算力、带宽、制程工艺等的量化指标,限制美国相关企业对中国出口,旨在影响中国 AI 和超算等行业发展。

受此影响,A100、A800无法提供到中国市场,随后英伟达在2022年第三季度投产“特供”中国市场的A800芯片,传输速率被限制、性能也有所降低。今年,英伟达又推出中国特供版的H800芯片,主要用于大模型训练,性能、传输均大幅下降,与H100差距高达40%以上。

如今,美国全面扩大对华半导体出口管制,随后推动英伟达 AI 芯片产品遭疯抢,价格也飙涨。据财新,此前一台包含8张英伟达H800训练卡的标准AI计算机现货价格约230万元,10月17日之后现已飙至超过270万元,且基本没有现货供应。而通过中间商从海外带货,单张H800卡的报价也上涨到35万-40万元。

另据一些英伟达代理商说,腾讯、字节跳动此前大量采购英伟达H800显卡,但至今未拿到现货。后续多家大模型企业和智算中心小规模采购的英伟达A800显卡,目前均不太可能再完成英伟达订单了。

同时,新的出口管制新规也将对一些与英伟达合作代理商的未来发展产生影响,例如七彩虹、技嘉、英迈、寒武纪等。这些企业高度依赖英伟达在中国大陆的销售运营,未来可能面临“换道”的命运。

不过,多用于消费级的RTX4090显卡和性能较低的L40没有出现在更新的限制令中。截至发稿前,英伟达并没有说明美国政府为何加快这一进程。

同样受到限制措施影响的英特尔公司,早前已对外表示正在“审查相关规定并评估潜在影响”。其于7月开始在中国销售Gaudi 2 AI 芯片。此外,根据新规,AMD受到部分VEU管辖,即可能已经受到了一定的技术豁免,暂不确定是否还可以在中国销售MI300系列新品。

另据消息称,英伟达正秘密研发用于个人电脑(PC)、基于ARM架构的中央处理器(CPU)芯片,支持Windows操作系统,预计最早可能在 2025 年上市销售。报道称,AMD也在谋划类似产品,均意欲挑战这一领域的霸主、也是其直接竞争对手英特尔的x86架构在PC领域垄断地位。

美国限制令下,中国极力解决算力“卡脖子”

当前,无论是台积电,还是英伟达,均成为美国限制令下掣肘中国算力发展的关键因子。而同时,先进制程、光刻设备等技术也无法在国内获得大范围发展,国内算力遭遇瓶颈。

在最近一场线上研讨会上,负责合规的律师就表达了悲观情绪,“美国对华半导体管制将保持高压态势。新规内容多而复杂,对任何物均有限制,企业应谨慎评估、合理应对。”

“半导体产业链供应链博弈正在成为中美竞争博弈的重点,美国加速对华脱钩、重振自身半导体产业的战略轮廓逐渐清晰,同时美国对华实施以半导体为核心的科技战将呈现长期性、谋划性和加剧性的发展趋势。中国必须做好打‘持久战’的战略准备。”该律师在演讲内容中写道。

当前算力对中国经济发展极为重要。2016年-2022年期间,中国算力规模平均每年增长46%,数字经济增长14.2%,GDP增长8.4%。

因此,中国已经开始加大算力布局。六部门近日联合印发《算力基础设施高质量发展行动计划》,从计算力、运载力、存储力以及应用赋能四个方面提出了到2025年发展量化指标。其中提出,到2025年,中国算力规模将超过300EFLOPS,智能算力占比达到35%,同时聚焦“算力+工业”“算力+教育”“算力+金融”等领域进一步深化行业应用。截至今年6月,中国在用数据中心机架总规模超过760万标准机架,算力总规模达到197EFLOPS。

IDC最新的报告指出,随着政府的支持加大,中国本土云端AI加速芯片制造商正在快速增长。最新数据显示,2023年上半年,中国AI服务器使用了50万块本地采购/开发的AI加速器芯片。这一数量占据了中国整个服务器市场的10%。

而关于这次新规对于半导体行业的更多影响,预计会在接下来一段时间还将不断显现。

Related Posts

Leave a Reply

Your email address will not be published. Required fields are marked *