摩尔线程简史:全面布局,进军消费者市场的 GPU 显卡先锋
1. 摩尔线程简史:光速创业全面出击
如今,我们已经有了相对成熟的独立CPU处理器、NAND闪存、DRAM内存、OS操作系统,但作为计算平台非常关键的一环,GPU显卡却一直严重欠缺,主要原因在于它不仅在硬件设计上难度极大,培育生态更是难上加难,并非一朝一夕就能实现。
国内做GPU的公司其实不少,但很多都局限于特定的行业领域或者面向高性能计算,真正敢于全面布局、敢于进军消费级市场的,不能不提摩尔线程。
5 月 31 日,Moore’s Threads 向快科技发出了 2023 年夏季发布会的邀请。我们原本以为这次发布会的核心会是新一代游戏和服务器显卡,但发现我们的布局太小,而 Moore’s Threads 的布局远不止于此。
从娱乐创作到AI与云计算,从国产数字办公到元宇宙,摩尔纹在全新游戏显卡及整机、DX11驱动、物理引擎、云桌面解决方案及一体机、开发工具、代码移植工具、AI内容创作、元宇宙与数字人等多方面带来了突破性进展,开启了国产GPU和生态的新篇章。
相信大家对摩尔线这个名字并不陌生,下面就来简单介绍一下它的历史。
Moore Threads成立于2020年10月,至今才成立两年半多一点,但却取得了令人瞩目的成绩。
Moore Threads的创始人为前NVIDIA全球副总裁兼中国区总经理张建中先生,他于2005年加入NVIDIA,带领团队在中国发展了完整的NVIDIA GPU生态系统,推动中国成为NVIDIA全球最重要的市场。
Moore Threads核心创始团队基本来自NVIDIA,拥有完整的高端芯片人才队伍,全面覆盖GPU芯片IP研发、系统软硬件设计、生态系统建设及市场营销等。
2022年,摩尔线程推出GPU统一体系架构MUSA,发布并量产“速帝”和“春晓”两款全功能GPU芯片。这也是国内唯一一款采用现代GPU架构,内置图形渲染、视频编解码、AI计算加速、物理模拟、科学计算四大引擎的全功能高端GPU芯片。
在产品方面,摩尔线程也迅速完成了全线的布局,速度之快、范围之广,简直就像是作弊一样。
硬件方面,包括面向数字办公的桌面显卡MTT S10/S30/S50、首款国产游戏显卡MTT S80、面向数据中心的全功能显卡MTT S2000/S3000。
软件方面,有首个元宇宙计算平台MTVERSE、自研GPU物理引擎AlphaCore、数字人解决方案DIGITALME、AIGC内容生成平台摩比马良等等。
MTT S30整机
MTT S3000服务器八卡并机
生态方面,摩尔线程已与200多家合作伙伴达成战略合作,特别是在整机、单板数字化办公国产化落地方面,实现高质量交付。
PES完美体验系统联盟合作伙伴的数量也在不断增长,涵盖了国内外主流CPU厂商、操作系统厂商、OEM厂商、软件服务商、云服务商、系统软件开发商等。
2. MTT S70、DX11和整机:软硬结合,真正玩起来
这次发布会,相信大家最关注的就是刚刚发布的第二款游戏显卡MTT S70了。不过在介绍它之前,我们先来简单回顾一下勇敢进军游戏市场的第一款MTT S80。
MTT S80基于代号“纯迪”的GPU芯片,集成200亿个晶体管,搭载4096个MUSA架构核心、128个Tensor核心,内置MUSA智能多媒体引擎2.0(H.264/H.265/AV1编解码)、MUSA安全引擎1.0、MUSA多位虚拟化引擎(SR-IOV)。
核心频率为1.8GHz,FP32浮点运算能力达到14.4TFOPS(每秒14.4万亿次),INT8整数运算能力达到57.6TOPS(每秒57.6万亿次)。
其搭载大容量16GB GDDR6显存,位宽256bit,等效频率14GHz,带宽448GB/s。
系统接口是国内首个也是目前唯一一个采用PCIe 5.0 x16的显卡,显示输出支持DP 1.2a、HDMI 2.1、8K30,也是国内首款支持Windows环境、支持DirectX图形接口的显卡产品。
MTT S70可以算是MTT S80的弟弟,整体造型基本保持不变,依然拥有精致硬朗的三风扇散热器,但规格有所简化。
核心数减少至3584个,核心频率降低至1.6GHz,FP32浮点运算能力达到11.2TFLOPS,系统接口改为PCIe 4.0 x16,支持四通道8K30超高清显示输出。
不过比较奇特的还是显存,容量设定到了史无前例的7GB,位宽对应224-bit,等效频率依然是14GHz,带宽392GB/s。
摩尔芯闻副总裁、产品事业部总经理董龙飞表示,摩尔芯闻做高端卡的理念之一就是用真材实料,S80提供了大容量16GB显存,非常适合高分辨率游戏、AI等场景,但成本也较高,因此开发了性价比更高的S70 7GB。
目前,MTT S70 7GB已经上市,售价2499元。
相比于硬件上的迭代,驱动、游戏等软件方面的进步更令人欣喜。
MTT S80发布近半年来,Windows驱动已完成5次升级,支持的游戏数量超过60款(当然还有更多的游戏可以玩但并未完全适配),目前网吧最流行的50款游戏中有20余款已经进行了适配。
游戏性能自发布以来平均提升了50%左右,尤其是《英雄联盟》、《穿越火线》、《DOTA2》等主流网游,《NBA2K Online2》的性能甚至达到了早期的2.5倍左右。
同时对50多种主板和30多种显示器也提供了很好的支持。
在此基础上,我们对Moore's Threads对DX11的支持更加感到兴奋。
与英特尔显卡优先推出DX12,随后又向下推送DX11、DX 9不同,服务于中国市场、服务于中国玩家的摩尔定律选择从拥有最广泛用户基础的DX9入手,满足更多玩家的迫切需求。
目前,摩尔定律显卡虽然不能保证所有的DX9游戏都能很好地运行,原因有很多,包括游戏开发不规范、其他厂商的显卡针对游戏优化、国外游戏与国内硬件匹配性不够等,但已经实现了对DX9的100%支持。
目前,摩尔定律已经开始向DX11全面冲刺,成为第一家真正支持DX11游戏的中国GPU公司。
按照计划,Moore Threads将在6月下旬发布DX11社区版驱动,初期将支持《原神》《DOTA2》等3A游戏。
同时,摩尔线程在“Mocha Player”社区发起了“Alpha行动”,呼吁更多玩家使用DX11社区版驱动并提供反馈,从而加速驱动的迭代速度。
据摩尔线程MTTS80、S70显卡产品经理马建介绍,目前DX11驱动进度在80%左右,摩尔线程将加快开放正式版下载。
Moore 的线程也已经计划用于光线追踪和类似 DLSS 的超分辨率技术。
考虑到MTT S系列游戏显卡毕竟是新品,软硬件的兼容性还处于起步阶段,为了方便用户更稳定的使用,最大限度的发挥显卡的潜力,摩尔纹此次还特别发布了整机产品“智慧娱乐立方体”。
智能娱乐立方体除了外观好看之外,还可选配MTT S80/S70两款显卡,并预装精选游戏中心,保证开机即玩。
同时其还内置PES系统管理中心,方便实时监控系统状态;联动云端应用,让你随时体验最新进展。
Moore Threads还将向用户开放Ubuntu驱动下载,以支持AI计算领域的学习和应用开发。
发布会上,我们还体验了基于MTT S70显卡的智能娱乐立方体。
精致小巧的整体设计让人眼前一亮,首批适配的DX11游戏运行十分流畅,画质和帧率完全可以满足主流玩家的需求,同时在开发和计算方面也是可圈可点。
3. 马良:AI最棒,更懂中文
人工智能无疑是当下最热门的话题,而想要实现好的人工智能应用,硬件的算力和创意平台都不可或缺。
摩尔线程从一开始就将AIGC作为核心发展方向,目前已正式推出集软件与硬件于一体的AIGC内容创作平台“摩尔线程”,为用户提供零成本的AI创作平台。
MobiMa Liang采用业界领先的多模态预训练大模型/生成扩散模型。
首先,多模态预训练模型通过海量图像和文本数据进行比较学习训练,掌握图像和文本之间的关系,构建图像和文本编码器。
在生成过程中,编码器会先对输入的文本进行隐式编码,并与图片、语义、图像蒙版等其他条件输入相结合,生成模型和解码器最终生成图像。
支持中英文双语文字描述,可一次性生成多张图片;
支持图像生成,通过边缘检测、骨架检测、深度检测等使图像更加准确。
支持多种模型、风格、艺术家,包括普通、人像、2.5D、ACG等;
支持敏感内容过滤,提供更安全的创作环境;
支持火柴人生成、相似度生成、局部替换、边缘延伸、高清超分辨率等多项个性化功能,并且作品可以以画廊的形式发布分享。
尤为值得一提的是,书法家马良对中国语言文化有更为准确和深入的了解,这有利于他进行中国书法和意境的创作。
摩比马良AIGC平台目前已上线内测,提供多种接入方式,用户可通过Web、小程序等方式登录,也可使用丰富的API进行远程调用。
对于需要完整解决方案的用户,Moore Threads还提供了私有部署能力,包括GPU集群、异构算力调度平台、API接口,以及与摩比马良类似的示例应用程序。
事实上,AIGC只是摩尔线程元宇宙战略的一部分,摩尔线程将围绕人、场景、内容提供元计算能力。虽然元宇宙概念热度不如从前,但摩尔线程认为元宇宙并未褪色,但需要更好的计算平台、更合理的应用场景去推动,这是一个长期的项目。
为此,Moore Threads对MTVERSE元宇宙平台进行了升级,目前已支持云端实时渲染。
MTVERSE是一个元宇宙平台,提供可扩展的性能、实时渲染和模拟以及AI驱动的多样化计算支持。
领先的第三方IDC服务商世纪互联率先在云端部署摩尔线程千卡级GPU算力集群,并结合MTVERSE平台与虚幻引擎、云端渲染流技术,为51WORLD旗下51Meet元宇宙高精度开放平台提供算力加速。
这是首个实现国产闭环的元宇宙应用,在多用户并发的情况下,用户可以享受低延迟、高保真、沉浸式的元宇宙体验。
此外咪咕元宇宙、智汇云洲视频孪生、看景三维重建等元宇宙应用也正在更新中。
此外,摩尔线程还升级了DIGITALME数字人解决方案,可应用于直播、社交、影视动画、办公、娱乐等场景。
DIGITALME解决方案包含“女娲”数字人生成器、“画皮”表情驱动引擎、“随影”动作驱动引擎、“随打”对话系统四大部分。
其中,“随答”主要升级了两项能力,一是通过语音与人进行自然交互,实现“能听、能说”,二是基于大语言模型的智能问答,实现“能有意义地思考、能说话”。
发布会上,摩尔线程展示了两款数字人产品解决方案——2D广播数字人和3D交互数字人。
有意思的是,这场发布会的线上部分,是由数字版的张建中主持,不少人表示,直到看完发布会,才发现一点端倪。
4、云桌面、数字化办公:降本增效新升级
今年初,摩尔线程推出了基于多功能服务器GPU MT S2000的云桌面产品及解决方案,包括vPC云桌面虚拟化GPU产品MT vGPU 1.0、MT GPU直通、MT GPU加速协议编码等。
在中国信息通信研究院的主导下,摩尔芯闻联合中国移动云、中国电信研究院联合发布《新型GPU云桌面发展白皮书》,明确定义了云桌面场景的体验标准。
基于此标准,在视频播放、网页浏览、办公、教育软件四大主要场景下,基于Moore Threads MTT S2000的单台服务器可以支持40个以上并发高清用户。
与传统CPU云桌面解决方案相比,其性能可提升近5倍,整体TCO成本可降低60%以上。
本次发布会上,云桌面产品MT vGPU升级至全新2.1版本,主要有四大变化:
首先,增加了对MTT S3000显卡的支持,单卡最多可以并发28台虚拟机,性能提升高达40%;
其次增加了对GPU超分辨率技术和SR-IOV虚拟化的支持,前者可以使虚拟机数量增加一倍,后者可以提供更好的QoS、隔离和安全性。
三、整体画质由1080p升级到4K;
第四,通过驱动更新,增加了对Windows Server服务器系统的支持,全面支持H.264、H.265、AV1视频编解码器,并支持更多浏览器和更多视频播放器。
同时,摩尔线程还推出了MCCX VDI云桌面一体机,这是包括服务器、瘦终端、软件在内的端到端完整交付解决方案。
其主要面向教育和办公领域,同时还有教育改革特别版和办公体验增强版。
其中教学改革专用版可有效加速Tello Edu、Code Craft等19款教学改革软件。
增强办公体验版针对Office及WPS办公软件、Adobe Reader PDF阅读器、视频会议、WinRAR解压软件等60多款办公软件进行定制优化。
目前,摩尔线程云桌面解决方案已适配天翼云电脑、移动云电脑等10余家客户的产品,并与深信服、新华三信息、华云、酷栈科技、听语科技等完成产品导入,将在各行业落地。
与此同时,摩尔芯闻国产数字化办公解决方案也实现全面升级。
Moore 的线程率先支持了 OpenGL 4.0 与 Vulkan 1.3 的全部功能,并通过了 100% 的接口兼容性测试,同时支持 Tessellation 表面细分等图形特性,提供更加精致的几何纹理效果。
随着国内生态系统的繁荣发展,无论是CPU处理器还是OS操作系统,都有各种各样的解决方案,有数百种组合,适配难度和复杂性。
为此,Moore Threads支持DKMS动态内核模块,方便快速适配各种CPU+OS版本组合,提高开发效率数十倍。
目前,摩尔芯闻办公解决方案已成功适配麒麟、openKylin、统芯、深度、凝思、中科方德、普华等国产操作系统,并率先与统芯UOS、麒麟OS完成全面兼容性认证,成为国内首家通过统芯UHQL质量认证的GPU企业。
此外,摩尔线程GPU已加速国内近百款应用,包括办公、视频会议、音视频、浏览器、视频编辑、设计、GIS等。
5. 开发工具:零成本移植到 CUDA
研发GPU和显卡本身就非常困难,软件开发和生态推广更是难上加难。尤其是全球GPU行业几乎被NVIDIA及其CUDA垄断,AMD和Intel很难撼动其地位,更何况国内厂商在这方面几乎没有经验。
2022年,摩尔线程推出了元计算统一系统架构“MUSA”,有点直接针对CUDA,包括统一的编程模型、软件运行库、驱动框架、指令集架构、芯片架构,可以说提供了从硬件底层到软件开发的完整解决方案。
Moore Threads围绕MUSA架构公布了一系列重要的技术更新。
第一个是软件工具包MUSA Toolkit 1.0。
其包含了MUSA驱动(通用计算/图形渲染/多媒体/多卡互联)、运行库、C++标准库、编译器、AI加速库、模板库、算法库、通用计算库、数学库、通讯库、多媒体库等,极其丰富。
可以说,这款软件工具包为开发者提供了一站式全套深度服务,可以根据需要从不同角度调用摩尔定律GPU的硬件能力,从而充分释放其计算能力和图形能力。
第二个是代码移植工具MUSIFY。
可以快速将现有的CUDA程序迁移到MUSA平台,零成本完成CUDA代码的自动化迁移。
自动迁移完成后,开发人员可以在短时间内完成热点分析和针对性优化,大大缩短迁移优化周期,省时、省力、省心。
过去这种移植需要数百个人日的开发成本,但现在有了MUSIFY,只需要几个或十几个个人日。
在目前GPU生态开发几乎完全围绕CUDA进行并专门针对其进行优化的环境下,能够在保证性能的同时实现快速简便的移植无疑是最合理的出路。
第三个是开源的MT PyTorch AI框架。
基于Moore’s Threads MUSA,开发者可以重用来自PyTorch开源社区的大量模型算子,降低开发成本,并支持各类模型的推理,涵盖CV、NLP、TTS语音、AIGC、数字人等领域,可运行ChatGLM、Stable Diffusion、LLaMA等典型的大模型分布式多卡推理。
MT PyTorch利用数据并行、模型并行、ZERO等分布式训练技术,可以完成简单基础模型和典型Transformer结构的NLP语言模型的训练。
第四是新版本的实时流体模拟工具Catalyst FX。
它基于摩尔定律自研的多平台物理引擎AlphaCore,无需改变原有工作流程即可直接在Houdini中制作流体特效,性能较原生PyroFX提升5-10倍。
AlphaCore对DX11 Compute Shader计算版本进行了深度优化,在流体力学模拟方面,运行Catalyst FX的MTT S80性能是市面上主流显卡的两倍以上。
此外,相较于传统Houdini Vellume制作流程,摩尔定律GPU加速柔性体模拟工具VeraFiber可将解决效率提高3-5倍。
目前,Catalyst FX与VeraFiber已完成Houdini插件接口的开发,Houdini插件Beta测试版将于6月6日开放下载。
应用合作方面,Catalyst FX Houdini版插件已交付给国内知名电影后期特效制作公司MOREVFX,VeraFiber被网易游戏投资的CG动画制作团队DOVFX成功运用,用于游戏CG开场中复杂人物的布料、头发等场景的模拟。
补习动漫、融创动漫、追光动画、平塔工作室等也是MooreThread AlphaCore的生态合作伙伴。
为了汇聚开发者力量,扩大生态,Moore Threads还推出了MUSA社区开发者计划。
Moore Threads将为合作伙伴和开发者提供全套MUSA开发工具、编程指南、系列教程、开源框架、模型库等资源。
Moore Threads将与第三方社区合作,推动新算法模型、计算系统和平台的发展。
六、结论:国产产品前景光明
摩尔线程刚出来的时候,很多人并不看好,毕竟在目前的环境和行业形势下,NVIDIA 等国际巨头几乎垄断了市场,重新开发一款国产 GPU,保证驱动的兼容性,构建完整的生态,充分释放各种计算和图形能力,并大规模商用,几乎是不可想象的。
可以说,从某种程度上来说,制造GPU显卡的难度要比制造CPU处理器高出很多。
不过,短短两年多时间,摩尔斯线程的表现还是值得更多人去了解他们的。
构建统一的系统架构,打造现代GPU架构,涵盖图形渲染、加速计算、显示和编解码、AI等。
硬件产品覆盖桌面、工作站、服务器、云等多个场景,快速投入商用,尤其我们非常勇于把游戏显卡带入大众视野,接受真实的测试和反馈;
驱动开发快速迭代,游戏和硬件兼容性稳步扩大,性能不断提升,潜力释放;
开发工具和软件产品不断丰富,为开发者和用户提供全方位的解决方案;
生态系统建设不断拓展,合作伙伴遍及各行各业……
作为GPU行业的新势力,摩尔定律迅速崛起,构建了丰富的产品线,将触角伸向图形、计算、AI等各个层面和场景,同时在开发和生态上不遗余力,其格局规模更是令人惊叹,突破速度令人瞠目结舌。
事实上,在目前的环境下,摩尔定律无疑选择了一条最艰难的道路。几乎从零开始构建一整套解决方案和生态,注定难度极大。但一旦真正实现突破,才真正能够自主掌控未来的命运。
这会是一次大的举措吗?摩尔螺纹对此有着清晰而长远的认识,从创业之初就有了明确的定位和方向。
摩尔线程副总裁、产品事业部总经理董龙飞直言,作为一家芯片公司,摩尔线程要做的不仅仅是推出几张卡,而是要充分认识到图形计算与AI融合的大趋势,从底层芯片架构出发构建,通过软件级加速,充分释放底层架构的功能和潜力,从而形成一个大产业。
作为一颗冉冉升起的新星,摩尔螺纹还有很多不足,还有很大的进步空间,但通过它两年来的实际表现,相信大家对它已经有了相当的了解和信心,对它的未来也抱有更多的期待。
文章评论
摩尔线程作为国产GPU行业的新星,在短短两年多的时间里取得了令人瞩目的成绩,其不仅构建了丰富的产品线并覆盖了多个场景和层面的应用需求;同时也在驱动开发、生态建设和开发工具等方面进行了大量的投入和创新工作以支持开发者和用户的需求与期望。"
摩尔线程作为国产GPU行业的新星,其快速崛起和全面的产品线布局令人瞩目,从底层架构到软件生态的全方位突破展现了其在图形计算与AI融合领域的雄心壮志及巨大潜力!