2024-01-11 05:47 点击次数:104
12月17日音信,据金羊网报说念,本月6日,以“超智会通,算启新篇”为主题的2023年超算立异专揽大会在广州浩荡召开。在这次大会上,国度超算广州中心认真发布了中心的新一代国产超等计较系统——“河汉星逸”。
据国度超算广州中心主任卢宇彤先容,“河汉星逸”以专揽为中心,承袭国产先进计较架构、高性能多核处理器、高速互连齐集、大规模存储等要害工夫构建,在通用CPU计较智商、齐集智商、存储智商以及专揽奇迹智商等多方面较“河汉二号”结束倍增,支执高性能计较、AI大模子锻练以及大数据分析等多种专揽场景的需求,将进一步提高国度超算广州中心的多规模专揽奇迹智商,为广州市、广东省和粤港澳大湾区的前沿科技打破、计谋工程成就、产业升级转型提供苍劲的高端算力与平台支执,有劲提高广州市手脚国度中心城市和概括性家数城市的中枢科技立异实力,支执区域科技经济社会高质地发展。
国度超算广州中心副主任陈志广示意,“河汉星逸”承袭了启程点进的超算工夫,比较原有系统,在通用算力上提高了5倍,何况强调了专揽智商的提高,专揽软件存在进一步发展的空间。超算互联网最终野心是结束宇宙联网,下一步盘算与深圳超算、无锡超算结束联网。
河汉星逸通用算力提高了5倍
而已表现,“河汉二号”部署在国度超算广州中心,它使用了Intel Xeon E5-2692 12核处理器及Xeon Phi 31S1P加快卡,共计领有312万个中枢,整机功率也达到了17808千瓦,表面性能是54.9PFLOPS(5.49亿亿次),Linpack峰值性能33.86PTFLOPS,从2013年6月份到2016年6月份它的性能齐莫得变化,连任了六次TOP500冠军。
河汉二号蓝本有后期升级盘算,可是2015年好意思国政府颁布禁令,严禁Intel等公司向中国四家超算中心出口高性能计较芯片,这么使用Intel Xeon Phi加快卡的河汉二号就不成再使用好意思国公司的高性能芯片了。
2017年9月份,广州超算中心告示2017年底前升级河汉二号超算系统,使用国产加快器Matrix 2000取代蓝本的Intel Xeon Phi加快器。据了解,Matrix 2000的整数架构应该是ARM,可是矢量单元是国内自界说的256bit VFU矢量单元。每个Matrix 2000由128个内核组成,频率为1.2GHz,每周期能实施16个双精度运算,处理器峰值性能为2.45TFLOPS。升级后的河汉二号被称为河汉2A,峰值性能从之前的54.9PFLOPS提高到了100PFLOPS傍边。
按照官方的说法,“河汉星逸”的通用性能比较原有系统(升级后的“河汉二号”,即河汉2A),在通用算力上提高了5倍,也即是说,“河汉星逸”的峰值算力应该达到了约600 PFlop/s(每秒50亿亿次)。
值得谨防的是,在本年11月10日在北京召开的“ChinaSC2023第五届中国超等算力大会”上,发布了2023中国高性能计较机性能TOP100排名榜,其中就暴露了排名第一的于2023年在超算中快慰装的“超算中心主机系统异构众核处理器”性能参数,其CPU核数达到15974400核,峰值性能达620PFLOPS,越过了神威·太湖之光。彰着,这个数据恰当前边对于“河汉星逸”算力的说法。
本年8月12日,国防科技大学公布的《国产河汉新一代超等计较机智能计较节点机时奇迹单一着手琢磨公告(2023-YKJSJY-F5027)》表现,“拟采购国产河汉新一代超等计较机智能计较节点36万节点小时的机时奇迹,用于测考试证动态风场计较软件的功能和性能。拟合营供应商:国度超等计较天津中心。”
对于遴荐国度超等计较天津中心为单一供应商的情理为:“因名堂需要在具备MT3000处理器的国产高性能计较系统上测考试证动态风场计较软件环境,需采购36万节点小时的国产高性能计较系统机时奇迹。天津超算主机系统是河汉一号系统(TH-1A)和河汉新一代系统(含E级考据系统)。其中,河汉新一代系统具备基于MT3000处理器的计较节点,大要闲隙名堂需求,且当今国内仅有天津超算能提供基于MT3000处理器的国产高性能计较环境。因此,本次采购拟承袭单一着手的样子进行。”
2018年7月,新华社曾报说念称,由天津超算中心研发的“国产新一代百亿亿次超等计较机——“河汉三号”E级原型机完成研制部署,并获胜通过分项验收。该原型机系统承袭了三种国产自主高性能计较和通讯芯片。”随后在2019年,进一步的报说念表现,“我国百亿亿次超算‘河汉三号’原型机已为30余家单元完成大规模并行专揽测试并迟缓绽开奇迹”。
鸠合上述信息来看,传奇中的具备E级算力的“河汉三号”承袭的恰是国产的MT3000处理器。而这次广州超算中心发布的“河汉星逸”很可能亦然基于MT3000处理器,诚然也有可能是基于传奇的Matrix 2000+。当今尚未联系于MT3000处理器的更进一步信息,不外不错详情的是,其性能比较上一代的MT2000将会带来大幅的提高。
国产E级超算神威·海洋之光
另外,值得一提的是,比较河汉2A性能更为深广的“神威·太湖之光”超等计较机系统,承袭了40960个中国自主研发的“申威26010”众核处理器,该众核处理器承袭64位自主申威领导系统,中枢责任频率1.45GHz,峰值性能3.168万亿次每秒。神威·太湖之光里装配有40960个这么的处理器,合座的峰值性能可达12.5亿亿次/秒,执续性能为9.3亿亿次/秒。
而传奇中的新一代神威超算——神威·海洋之光(Sunway Oceanlite)将承袭全新的申威 SW26010-Pro 处理器,瞻望将带来更为深广的性能。
在本年11月召开的SC23 (International Conference for High Performance Computing, Networking, Storage, and Analysis,是高性能计较、体捆绑构规模顶级会议)大会上,我国科学家向世界展示了全新的申威 SW26010-Pro 处理器,性能比上一代提高了四倍。这是我国承袭自主领导集(基于 Alpha 进行推广),具有总共自主常识产权的处理器系列居品。
凭证PPT而已表现,SW26010 pro是SW26010纠正型,领有6个中枢模块和 1 个条约处理单元(PPU)组成,每个模块有1个惩处Linux线程的中枢(MPE)和64个计较中枢,共计384 个内核,比较之下上一代的SW26010 唯有 4 个中枢组,评释SW26010 pro单芯片应该有50%的性能提高。
SW26010 Pro处理器的64个(8×8)计较中枢齐集是一个具有256KB L2高速缓存的计较处理单元(CPE)。每个CPE有四个逻辑块,不错在一双上支执FP64和FP32,在另一双上则不错支执FP16和BF16。
SW26010 Pro中的每个中枢模块上齐有一个DDR4-3200内存为止器和16 GB内存,内存带宽为51.4 GB/秒,因此扫数处理器有96 GB主内存(比较 SW26010 的 32 GB 结束了权贵提高)和307.2 GB/s带宽。六个CPE通过环形互连邻接,并有两个齐集接口,使用私有互连将它们邻接到外部。SW26010 Pro芯片的FP64或FP32精度为14.03 PB,BF16或FP16精度为55.3 PB。
另外,SW26010 Pro的MPE内核脱手在2.1 GHz(前代居品仅 1.45 GHz),CPW内核脱手在2.25 GHz,再加上全新 64 位 RISC 微架构和系统架构的纠正,其 FP64 计较隐隐量也加多了四倍以上。
据先容,神威·海洋之光最大的配置越过100000个节点,共有越过4100万个中枢,散布在大要105个机柜中,峰值半精度(FP16)性能越过5 Exaflop/s,FP64的表面峰值性能为1.5 exaflops,仅次于好意思国Frontier超等计较机。
据The next platform此前报说念称,淌若将神威·海洋之光的规模扩大到120个机柜,在FP64 pervision下的峰值将达到1.72 Exaflops,这将越过好意思国橡树岭国度推行室的1.68 Exaflops的“Frontier”超等计较机。在160个机柜的条目下,在FP64的峰值性能将接近2.3 Exaflops,将有望打败如故装配完成的好意思国动力部阿贡国度推行室的基于英特尔CPU及GPU的新一代超等计较机“Aurora”,以及正在成就的好意思国劳伦斯·利弗莫尔国度推行室基于AMD MI300芯片的“El Capitan”超等计较机,后两者的FP64性能齐将达到 2 Exaflops以上。
裁剪:芯智讯-浪客剑
Powered by 开云真人(中国)官方网站 @2013-2022 RSS地图 HTML地图
鄂ICP备2020021473号-1