摩尔线程：新一代国产GPU浅析-技术圈

3月30日，摩尔线程举行主题为“元动力创无限”的春季发布会。摩尔线程创始人兼CEO张建中解读了“元计算”这一产业趋势，并表示：“元计算时代已然开启，多功能GPU是元计算的算力基础设施，也是我们创新的原点。元计算是支撑包括元宇宙在内的下一代互联网应用的通用算力平台，以图形计算和AI计算为基石，是物理世界数字化和数字世界物理化的底层算力支撑，将为数字经济开辟更广阔的发展空间。”

在此次春季发布会上，摩尔线程发布第一代MUSA系统架构GPU。据介绍，MUSA是摩尔线程产品系列采用的统一系统架构，包括统一的编程模型、软件运行库、驱动程序框架、指令集架构和芯片架构。开发者基于MUSA开发的应用将具备广泛的可移植性，可以同时运行在云端和边缘的众多计算平台上，包括面向图形、计算、多媒体和人工智能的各类产品线。

苏堤是基于MUSA统一系统架构打造的第一代摩尔线程多功能GPU芯片产品。该芯片内置现代图形渲染引擎、智能多媒体引擎、AI计算加速引擎、物理仿真及科学计算四大引擎，旨在以先进的现代GPU架构、广泛的平台通用性和全栈计算能力，充分满足数字经济云边端多元算力需求。至此，摩尔线程成为目前中国市场率先进行多功能GPU研发设计、并能以极快速度实现GPU量产交付的公司。

在发布会上，摩尔线程还同时发布了多款重磅新品，包括面向PC和工作站的桌面级显卡MTT S60和专为数据中心打造的图形渲染和计算卡 MTT S2000；GPU物理引擎AlphaCore ；DIGITALME数字人解决方案；及助力数字经济发展的多个元计算应用解决方案。

MTT S60

面向PC和工作站的桌面级显卡

MTT S60是摩尔线程首款突破性多功能智能显卡，主要面向PC和工作站。MTT S60是基于MUSA统一系统架构GPU苏堤核心晶片制成，采用12nm制程，包含2048个MUSA核心，单精度算力最高可达6TFlops，配置8GB显存，基于MUSA软件运行库和驱动程序等软件工具，MTT S60显卡能够在不同应用场景中展现多重优势。

广泛的生态平台支持：MTT S60显卡支持包括英特尔、AMD、飞腾、龙芯、兆芯、海光在内的各型CPU平台，同时支持Windows 10、麒麟、统信及多种Linux操作系统。MTT S60显卡凭借其领先的现代GPU架构、平台通用性和对新兴CPU及操作系统的支持，将极大推动中国数字化基础建设。
丰富的图形API接口：MTT S60显卡支持DirectX、Vulkan、OpenGL和OpenGL ES等众多图形API接口，可满足GIS、BIM、设计、主流游戏、原生Android、三维渲染等应用对图形性能的需求。
通用AI功能支持：基于全栈功能GPU的通用计算能力，MTT S60显卡能够加速DBNet、CRNN、Yolo、Restnet50/101等广泛的AI模型推理计算，支持OCR、图像处理和视频增强等多种复杂人工智能场景。由此，能够释放强大的AI能力，加速普及PC级AI应用。
领先的硬件视频编解码能力：MTT S60显卡不仅支持主流的H.264和H.265编码格式，还领先行业同类产品，提供了对AV1视频格式的硬件编码支持，能够帮助企业及机构降低视频处理成本；而在硬件解码方面，MTT S60显卡则支持 AV1、H.264、H.265等诸多格式的硬件解码。借助强大的视频编解码能力，搭载摩尔线程MTT S60显卡的计算机能在影音娱乐、视频监控、视频剪辑等应用中降低CPU负载，提升计算机整体效能和性能。
最高可达8K的高规格显示输出：MTT S60显卡提供3个DisplayPort 1.4规格接口，支持8K/4K 画面显示，可满足大屏高解析度的娱乐及工作需求。
8GB大容量显存：MTT S60显卡搭载8GB 低功耗LPDDR4x显存；由于支持多种纹理压缩算法，显存带宽的利用率也得以显著提高，使得MTT S60显卡能在复杂模型设计、高清视频处理以及大AI模型等高负载应用中提供更高的显存带宽利用率，发挥更大效能。
PES控制中心：MTT S60显卡为用户提供了一站式的图形化管理控制中心。借助该工具，用户不仅可监控GPU运行状态并进行相关的2D/3D图像输出设定，更可提供无需人工干预的显卡驱动更新等功能，使显卡能够在不同应用环境中获得持续的优化和兼容性改善。

生态协作始终是推动产业和体验升级的关键所在。目前，摩尔线程MTT S60支持英特尔、AMD、龙芯、飞腾、兆芯等主流CPU以及Windows、麒麟、统信、Ubuntu等操作系统，并且已经着手与众多PC合作伙伴开展合作，包括联想、浪潮、清华同方、长城超云等（排名不分先后）。

此外，摩尔线程还发起并携手众多行业合作伙伴共建中国“完美体验系统联盟（PES联盟）”，旨在通过产品规划、研发、最终生产阶段的协同合作，聚焦统一标准、整合资源、分享技术等，为生态伙伴创造更多价值，为终端用户打造完美体验。

MTT S2000

专为数据中心打造多功能GPU

MTT S2000是摩尔线程基于MUSA统一系统架构苏堤核心晶片打造的数据中心级多功能GPU产品。MTT S2000内置渲染、音视频编解码、人工智能加速和并行计算等硬件模块，能够提供图形图像渲染、视频云处理、AI和科学计算在内的全栈功能。凭借其独特的渲染、虚拟化等能力和广泛的生态支持，MTT S2000可以在云桌面、安卓云游戏、视频云、云渲染和AI推理计算加速等应用场景全面助力绿色数字经济发展。

MTT S2000采用12nm制程，使用4096个MUSA核心，最大配置32GB显存，单精度算力最高可达到12TFlops，支持H.264、H.265、AV1多路高清视频编解码，以及广泛的AI模型算法加速。MTT S2000采用被动散热、单槽设计，满足数据中心高密度GPU配置方式。

为提升MUSA架构产品在实际生产环境中的表现，摩尔线程还为MTT S2000系列产品推出了针对硬件架构进行专门优化的统一编程模型、运行库、驱动等软件工具，可方便开发人员完成应用的移植和适配，充分调用MTT S2000的硬件资源和算力。MTT S2000支持OpenGL、OpenGL ES、DirectX、Vulkan等图形API；通过FFMPEG和VA-API/DXVA等兼容支持音视频处理生态；并通过OpenCL及Vulkan满足AI和科学计算的程序兼容。

加速PC云桌面：摩尔线程MUSA架构所采用的MT Mesh 1.0 GPU虚拟化技术使MTT S2000能够在虚拟化架构中获得更高的性能和效率。MTT S2000是国内率先基于硬件的GPU 虚拟化解决方案，以行业标准SR-IOV（单根I/O 虚拟化）技术为基础，实现每个物理GPU 上容纳多个虚拟化用户远程工作。
MTT S2000虚拟化技术将极大地促进云桌面用户体验提升。用户既可以按照传统GPU直通式方案，将一个GPU与单个虚拟机进行绑定以获得单应用的最大性能；也可通过GPU虚拟化的方式将GPU分配给众多虚拟机，以实现尽可能高的算力资源使用率。同时，在虚拟机中，摩尔线程提供了对Windows和Linux操作系统的同时支持，并兼容DirectX、OpenGL、Vulkan等渲染API，保证了用户应用程序的兼容性。同时，借助摩尔线程DirectStream技术，MTT S2000可以一体化更快速完成渲染编码，以及并发支持多路的视频编码，有效降低CPU负载和系统时延。
原生Android云游戏加速：MTT S2000支持ARM架构，并支持鲲鹏、安培、飞腾等CPU的服务器产品。MTT S2000直接提供对OpenGL ES接口的原生支持，并支持ETC/ETC2/ASTC/S3TC等纹理材质的硬件处理，这使得MTT S2000显存带宽的使用效率能够获得2.4倍提升，从而让摩尔线程GPU在云手机和云游戏中展现出更好的渲染效率。同时MTT S2000还搭载了摩尔线程第一代安卓云加速平台（Android Cloud Accelerator，ACX），通过安卓驱动透传和GPU硬件编码大幅提升了安卓云手机、云游戏应用的计算效率并极大提高了安卓系统兼容性。
加速视频云计算：基于独立的硬件编码器和解码器，MTT S2000能够完成多路并发的硬件编解码，大幅提升视频云的计算效能。在格式支持方面，MTT S2000不仅能够实现H.264和H.265等视频格式的硬件编码，更率先提供了对下一代编码标准AV1的硬件支持。在解码方式方面，MTT S2000则能够对H.264、H.265、AV1、VP9/VP8等格式提供硬件支持，在云端视频转码、视频压缩、网络视频、直播、远程会议、监控等行业有着极广的适用范围。
云端Unreal/Unity应用渲染：MTT S2000针对Unreal和Unity等应用渲染框架，在驱动上进行了深度适配和优化，以保证充分发挥GPU内部的硬件能力。无论是传统渲染框架的渲染，还是AI辅助的渲染，摩尔线程全栈功能的GPU都能够予以支持和加速。
加速AI计算：得益于丰富的模型库支持和先进硬件设计，MTT S2000能够满足计算机视觉、自然语言处理等多种智能应用场景的模型训练和推理应用，并对包括DBNet、CRNN、FastRCNN、Yolo V2/V3/V5、PSENet、Mask RCNN、Resnet 50/101、Inception、Vgg、Alexnet、Densenet、Unet等在内的众多主流深度学习算法提供支持。同时，MTT S2000也支持用户使用PyTorch、TensorFlow、PaddlePaddle等深度学习框架进行算法开发及应用搭建。此外，用户也可通过应用更广泛的OpenCL及CUDA环境进行开发，大幅降低了新硬件的学习及应用门槛，提升开发速度。

摩尔线程MTT S2000兼容X86、ARM等CPU架构以及主流Linux操作系统发行版，并已着手与多家服务器合作伙伴开展合作，包括浪潮、新华三、联想、清华同方、长城超云、思腾合力（排名不分先后）等OEM厂商的多款通用服务器及GPU服务器型号，可以在众多硬件和应用环境中完成部署。

AlphaCore

下一代多平台GPU物理引擎

AlphaCore 是由摩尔线程独立设计研发的下一代多平台GPU物理仿真系统，能够对物理世界中复杂的固体、柔性体、流体等效果进行超高精度的物理仿真处理，通过运算模拟，让布料、毛发和数字角色软体肌肉组织的物理交互效果达到电影级别般真实。

AlphaCore 物理引擎凭借强大的材料力学模块，可以实现丰富的材料交互动态效果，例如：弹塑性材料、各项异性材料、羽绒服、皮革、丝绸、绵纶等。基于AlphaCore开发的系列工具包括：布料毛发制作工具——VeraFiber；气体流体仿真工具——Catalyst；以及生物仿生计算工具——Bionics。对比Houdini Vellum 的软体毛发布料和PyroFX 的烟火流体， AlphaCore 均有 5~10倍的性能提升。

同时，AlphaCore也提供了多平台兼容版本，以最大程度兼容现有生态中的Vulkan、CUDA、DirectX等 Runtime API环境，及Houdini，Unreal，Unity和D5游戏引擎和设计软件，广泛覆盖影视后期制作、动画、游戏、建筑表现等领域的实际应用场景。