突发!英伟达、AMD 恐断供高端 GPU,中国 AI 计算或需另起炉灶

FightingCoder

共 4526字,需浏览 10分钟

 · 2022-09-16

285f45d4fa1ef5420be8f6e775383447.webp



这是「进击的Coder」的第 722  篇分享 编辑:编辑部 来源:新智元报道  

阅读本文大概需要 8 分钟。




【新智元导读】近日,AMD 和英伟达接到消息,美国政府要求其对中国区断供高端 GPU。

8 月 31 日晚,集微网突然发布消息称,AMD 和英伟达中国区已相继接到总部通知,要对中国区客户断供用于人工智能和数据中心的顶级计算芯片。
AMD 方面:
  1. 暂停对中国区所有 MI100 和 MI200 发货;
  2. 统计中国区 Ml100 已发货量;
  3. 统计中国区 MI200 已发货客户清单和发货明细。

英伟达方面:
  1. 暂停对中国区所有客户所有代理商的 A100 和 H100 的发货,其它 GPU 卡不受影响;
  2. 各服务器 OEM 库存的 A100 可以对各自的行业客户继续交付, 英伟达中国区目前没有对 OEM 发任何 Letter。

目前,英伟达 H100 在今年 GTC 大会上刚刚发布还未出货。但已经出货 2 年的 A100 在最新 MLPerf 中,打破 16 项性能记录领跑。
可见,仅英伟达这两款高端 GPU 的断供,直接打击了智能计算以及 AI 大模型的训练。
截至发稿前,AMD 和英伟达都未予置评。

美国再次加大力度!


遗憾的是,这个消息似乎并不是空穴来风。
根据英伟达向美国证券交易委员会提交的一份文件,美国政府已于 8 月 26 日对英伟达下发了通知,对现有的 A100 和即将推出的 H100 提出了新的出口管制许可,并立即生效。
6095a4e82af2699fac6fea4cb19e3493.webp
此外,DGX 或任何其他采用 A100 或 H100 和 A100X 的系统,以及未来任何能够在峰值性能和 I/O 性能达到或高于 A100 的,都在新的许可证要求范围之内。
文件显示,该禁令针对的地区为中国大陆、中国香港和俄罗斯。 不过,英伟达在俄罗斯并没有付费客户。
英伟达表示,此举可能会影响到 H100 的开发,以及支持 A100 现有客户的能力,并可能进一步要求公司将某些业务从中国转移出去。
79c568434ae4f9b84ae0427295a530c1.webp2022CTC大会H100发布
目前,英伟达正与美国政府接触,试图为公司的内部开发和支持活动寻求豁免。
英伟达发言人也表示,「我们正在与中国客户商讨对策,以满足他们计划或未来购买替代产品的需求。如果客户需要的替代产品不足,我们会为客户寻求豁免或许可证,但不能保证美国政府会批准,或及时回应。」
受该禁令的影响,英伟达股价开盘后下跌近 6.6%。
9a6252aa294f4b63987bad8895467e9a.webp
在 8 月 24 日英伟达曾预计,第三财季销售额约为 59 亿美元,然而禁令一出,英伟达第三季度在中国的潜在销售额可能会损失 4 亿美元,如果客户不想购买替(旧)代(的)产品,而美国政府不及时或拒绝向重要客户发放许可证的话。
此外,据 AMD 的一位发言人称,美国政府也已经通知他们说要停止向中国出口顶级的人工智能芯片。
AMD 表示,新的许可要求将阻止 MI250 芯片运往中国,但 MI100 芯片应该不会受到影响。
AMD 认为,新规并不会对其业务产生实质性影响。但股价仍在开盘后下跌了。
737311c98c2fca3d2565b1a4218e3c89.webp

对国内影响有多大?


近年来,美国不仅针对中国不断地加强芯片的出口限制,并且还试图将制造业带回本土。
拜登已经正式签署《芯片与科学法案》,美国商务部向中国断供了可用于 14nm 以下先进制程芯片制造的设备,实施了对 EDA 软件工具的出口管制,且美国正在促成与其他国家的结盟。
而美国此次对英伟达和 AMD 实施芯片的出口禁令,除了阻碍英伟达在中国高达 4 亿美元的业务以外,还会影响国内 AI 领域的研究。
8dc37dc60052e407f382bfbe7d846c0e.webp

不过目前来看,对消费电子领域的影响并不严重。除了这两家的芯片,还有像高通、联发科、三星等芯片可用。
智能计算
但是,大多数国内服务器离不开这两家都芯片。显然,美国的这番断供就是冲着算力去的,目的就是阻碍中国在人工智能领域领先世界。
建设强大的智算中心就需要高端 GPU,如果没有智算,智慧交通、智慧城市、工业互联等众多领域都会受到影响。
因此,芯片断供将会直接影响国内的云计算产业及人工智能产业的发展。
根据 6 月份最新全球超算 TOP500 榜单,排在前十的超算中基本上都用到了 AMD、英伟达、英特尔的处理器或技术。
其中,中国神威·太湖之光超级计算机用的是我们自主研发的神威 26010 众核处理器。天河二号超级计算机则是使用基于英特尔集成众核架构的 Xeon Phi 31S1P 协处理器。
因此,断供 AMD 和英伟达对我国最有影响力的两大超算并未造成影响。
4fc313e96e4546a02e86fd6ce83ae840.webpbc595d239ef1c515070a403abd9b5664.webp
然而,对于国内提供服务器的企业来讲,就不那么幸运了。 服务器都是企业用得多,比如数据中心、云计算。
目前,国内像阿里等公司都在开始自研云原生处理器,这是值得肯定的。
元宇宙
要知道,GPU 是元宇宙核心计算资源的底座。未来,元宇宙市场规模或超 4700 亿美元。
元宇宙中有大量的程序需要计算,构成元宇宙的虚拟内容、区块链网络、人工智能技术都离不开算力的支撑。
没有强大的算力支撑,元宇宙就如同空中楼阁。
因此,元宇宙中更加真实的建模与交互需要更强的算力作为前提,更加说明我们自研 GPU 的重要性。

4d2dc544b97da93fe99d88a802e20524.webp


AI 大模型
另外,如果没有英伟达和 AMD 等公司的芯片,国内在图像、语音识别以及其他机器学习方面的任务也将受到严重的影响。
2020 年大火的 GPT-3 参数规模达到 1750 亿,而且,其训练数据集规模也超过 500GB。
训练这么大的 AI 模型,必然会吃很大的算力,仅 GPT-3 就消耗了 10000 块 GPU,花了 30 天才完成。
那么,断供高端 GPU 将如何影响国内 AI 模型的训练呢?
拿英伟达 A100 来举例,它的深度学习性能在 2021 年的实测中可达 V100 的 3.5 倍。而在最新的 AI 芯片跑分大赛结果中,A100 打破了 16 项性能纪录。
相比于「只有」540 亿个晶体管的前辈 A100,英伟达在 H100 中装入了 800 亿个晶体管,并采用了定制的台积电 4nm 工艺。
在算力上,H100 的 FP16、TF32 以及 FP64 的性能都是 A100 的 3 倍,分别为 2000 TFLOPS、1000 TFLOPS 和 60 TFLOPS。此外,H100 还增加了对 FP8 的支持,算力高达 4000 TFLOPS,比 A100 快 6 倍。
在 AI 训练中,如果采用 H100 来训练 GPT-3 的话,就可以将速度提升 6.3 倍,如果结合新的精度、芯片互联技术和软件,则可以提升至 9 倍。

33eae53afeb0914e3c90820bd50f3261.webp

此外,在新的 Hopper 架构加持下,大型模型的训练可以在数天甚至数小时内完成。


其中,Transformer Engine  可以用 2 倍于 FP16 的速度打包和处理 FP8 数据,于是模型的每一层可以用 FP8 处理的数据都可以提升 2 倍的速度。

 

50a0b1cc54f48182eb0191a952d702ce.webp


如果美国真的对高端 GPU 断供,国产 GPU 是否有可行的替代方案呢?

国产 GPU 准备好了吗?


「芯智讯」在一篇较为详尽的总结中表示,从整体来看,目前国产 GPU 仍处在一个发展的初期。
在图形显卡领域,只有景嘉微取得了一些成绩,但与英伟达和 AMD 还有较大的差距。
而对于此次断供影响到的高性能计算领域,文章分析称,仅天数智芯、壁仞科技和芯动科技有推出相应的产品。
其中,根据壁仞科技官方公布的数据,BR100 在 AI 算力方面已经超过了英伟达的 A100。不过,由于该产品才刚刚推出,所以仍需要市场来检验。
一直以来美国对国内不断打压,国产 GPU 厂商也在加速自身研发,就是为了在紧要关头能够实现自给自足。
现在,这条自研路仍任重道远。
b56a2b9fef1ac6f9efc8feb270bad7d1.webpf474f69278f4764ace64a80f39982ba3.webp
参考资料: https://mp.weixin.qq.com/s/V7X2gRVZchHVg9WTrI_P-g https://laoyaoba.com/n/831077 https://www.reuters.com/technology/nvidia-says-us-has-imposed-new-license-requirement-future-exports-china-2022-08-31/ https://www.reuters.com/technology/amd-says-us-told-it-stop-shipping-top-ai-chip-china-2022-08-31/ 0161b73550756ad81b73c6ceeb3b8f5a.webp

End

崔庆才的新书《Python3网络爬虫开发实战(第二版)》已经正式上市了!书中详细介绍了零基础用 Python 开发爬虫的各方面知识,同时相比第一版新增了 JavaScript 逆向、Android 逆向、异步爬虫、深度学习、Kubernetes 相关内容,‍同时本书已经获得 Python 之父 Guido 的推荐,目前本书正在七折促销中!

内容介绍:《Python3网络爬虫开发实战(第二版)》内容介绍


94e65fc7273de8375c1e5ff10072575c.webp


扫码购买





好文和朋友一起看~
浏览 25
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报