2015年中国高性能计算机发展现状分析与展望

科研信息化技术与应用2015, 6(6) : 83–92

NEWS & VIEWS··资讯观察 /

2015 年中国高性能计算机发展现状分析与展望

张云泉

中国科学院计算技术研究所 计算机体系结构国家重点实验室,北京 100190

摘  要:

本文根据 2015 年 11 月发布的中国高性能计算机 TOP100 排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。我们发现,由于国际超算发展态势整体放慢,中国 TOP100 的平均 Linpack 性能和入门门槛继续保持比国际 TOP500 高的局面。随着联想对 IBM X86 服务器并购的完成,中国 TOP100 上的超级计算系统几乎 90% 以上都是国产超算系统,曙光、联想和浪潮三强争霸的局面已经形成。安装在中国大陆的超算系统在 2015 年 11 月 TOP500 上的数量再创新高,紧跟美国之后排名世界第二;而中科曙光生产的超算系统更是历史性的首次闯入世界前三强,排名 HP 和 Cray 之后。中国的超算系统研制水平和能力经过十多年的快速发展,已经跻身世界先进水平的行列。在此基础上,根据十四届排行榜积累的性能数据,我们对未来几年中国大陆高性能计算机的发展趋势进行了分析预测。我们认为:峰值 100Petafl ops 的机器将在 2016 年出现,100Peta fl ops Linpack 性能的机器将在 2016 年到 2017 年出现,累计 Linpack 性能将在 2017 年到 2018 年间达到 1000Petafl ops ,峰值 Exafl ops 的机器将在 2018 年到 2019 年间出现。

关键词:高性能计算机;TOP100;排行榜;性能;分析

doi: 10.11871/j.issn.1674-9480.2015.06.010

State-of-Art Analysis and Perspectives of 2015 China HPC

Zhang Yunquan

State Key Laboratory of Computer Archintecture, Institute of Computing Technology, Chinese Academy of Sciences, Beijing, 100190, ChinaAbstract:

In this paper, according to China HPC TOP100 rank list published in November 2105, the performance,

基金项目:国家高技术研究发展计划 (863 计划) (2006AA01A105)

83

manufacturer, and application area of 2015 China TOP100 supercomputers are analyzed in detail. It shows that the average Linpack performance of China TOP100 surpasses again the average of world TOP500 supercomputers. Over 90% of these HPC systems are manufactured in China, and Sugon, Lenovo, and Inspur are the dominate manufacturers. The total number of world TOP500 HPCs located in China again increases to the No.2 in the world, following the US. Sugon becomes one of the top three supercomputer manufacturers in the world, following HP and Cray. Based on the public available historical data and the data of peak performance in previous 14 China HPC TOP100 lists, it could predicted that in China the supercomputer system with peak Linpack performance 100 petaflops would appear between 2016 and 2017, the total Linpack performance of China TOP100 would surpass 1000 petaflops between 2017 and 2018, and the Exaflops supercomputer would appear between 2018 and 2019 in China.

Keywords:high performance computer; TOP100; rank list; performance; analysis

1 背景

在国际上,自 1993 年起每年都会按 Linpack 的测试性能公布在世界范围内已安装的前 500 台高性能计算机排行 [1],成为高性能计算机研制生产、市场发展、应用交流和趋势分析预测的重要参考。在 2002 年之前,我国的高性能计算机未曾向国际申报 Linpack 性能测试结果,故而未列入国际 TOP500 排行榜。在中国软件行业协会数学软件分会发布首次中国高性能计算机排行榜的 2002 年当年,就实现了零的突破。在中国 TOP50 排行榜中名列第一的联想深腾 1800 万亿次机群名列 2002 年世界 TOP500 第 43 名,结束了在世界 TOP500 排行榜没有国产高性能计算机的历史。2003 年,在中国 TOP100 排行榜中名列第一的联想深腾 6800 万亿次机群名列 2003 年世界 TOP500 第 14 名,达到了国产高性能计算机的历史新高。2004 年,在中国 TOP100 排行榜中名列第一的曙光 4000A 更是取得了 6 月份 TOP500 排行榜世界第十的历史性突破,引起世界关注。在 2005 年,中国 TOP100 的第一名自发布以来首次被国外厂商夺走,但国产计算机所占的份额却首次赶超国外计算机,国产计算机亦喜亦忧。由于处于发展的平台期,2006 和 2007 年中国 TOP100 排行榜让人开始为国产并行机担忧了,不但第一名的位置未夺回,所占份额维持在 40% 左右,未见增长。在国家“十一五”863 计划的“高效能计算机与网格软件”重大专项里部署84

了研制更大规模的 Petafl ops 的高性能计算机的课题,并在 2008 年底推出了峰值超过百万亿次的两台国产高效能计算机。我们在2008年发布的中国 TOP100 排行榜中看到了国家 863 项目对改变国产高性能计算机现状的显著推动作用。2009 年,这一推动效果更加明显,2009 年 10 月发布的国产天河一号千万亿次超级计算机以 563.1TFlops 的 Linpack 性能名列 2009 年 11 月国际 TOP500 排行榜的第 5 名,是国产超级计算机首次进入世界前五名,取得了历史新高。2010 年 9 月发布的国产天河一号 A 千万亿次超级计算机通过采用先进的 CPU+GPGPU 的异构混合加速体系架构,以 2.56PFlops 的 Linpack 性能夺取 2010 年 11 月国际 TOP500 排行榜的第一名, 是中国国产超级计算机首次夺得世界冠军;我国安装的超级计算机的上榜数量也首次超越日本和欧盟, 排名世界第二,仅次于美国,标志着我国超级计算机硬件的研制水平达到国际领先水平。但是,美日欧等国从不甘心将世界第一的位置长久的让中国国产超级计算机占据,仅仅在 2011 年起不到 2 年的时间里,日本和美国先后投入巨资研制成功京速机、红杉和 Titan,先后重新夺取了三次世界第一的位置。2013 年,我国的高性能计算机科研工作者戒骄戒躁,刻苦攻关,勇攀高峰,于 2013 年 6 月凭借由国防科大研制的天河 2 号超级计算机,再次夺取世界 TOP500 第一名。迄今为止,中国研制的天河系列超级计算机已经七次夺取世界第一名,天河二号更是取得了六连冠的辉煌成绩,牢牢占

稳了中国在世界 TOP500 超级计算机冠军俱乐部中的位置。此外,安装在中国大陆的超算系统在 2015 年 11 月 TOP500 上的数量猛升三倍达到 109 套,再创历史新高,紧跟美国之后排名世界第二,但是美国在 TOP500 上的超算系统数量降低到历史上的最低点;而中科曙光生产的超算系统更是历史性的首次闯入世界前三强,排名 HP 和 Cray 之后。超级计算系统作为计算科学的必备基础设施,已经成为国家之间的战略必争点和创新转型的利器,各国都投入巨资争夺世界制高点。中国的超算系统研制水平和能力经过十多年的快速发展,已经跻身世界先进水平的行列。美国虽然仍是世界超算的强国,但是其数量已经降低到不足 40% 的份额,难以恢复十年前独霸世界 TOP500 70% 系统的盛况。

此次测评按国际惯例选用 Linpack 测试 (HPL) [4],2008 年 9 月底发布最新的 2.0 版本。本文给出对中国软件行业协会数学软件分会联合国家 863 高性能计算机评测中心和中国计算机学会高性能计算专委会于 2015 年 11 月发布的中国高性能计算机性能 TOP100 排行榜 [1] 数据的深入分析与展望。文中的图表数据

主要来源于中国 HPC TOP100。以下将中国 HPC TOP100 简称中国 TOP100[2]。

2 总体性能分析

本节图 1 和表 1 分别给出的是中国 TOP100 的总体性能发展趋势图以及 TOP10 计算机情况的列表。

和 2015 年 11 月发布的世界 TOP500 高性能计算机的情况相比较,可以看到:

• 2015 年 11 月世界 TOP500 总 Linpack 性能达到了 418.3PFlops,是 2014 年 309 PFlops 的 1.35 倍,增速继续变慢;而根据 2015 年中国 TOP100 排行榜的数据,中国 TOP100 的总 Linpack 性能是 85.1PFlops ,是 2014 年 68.6PFlops 的 1.24 倍,增速较 2013 年的 1.2 倍缓慢上升。

世界 TOP500 的前十名系统,几乎没有什么太大变化,仅仅第六名和第八名换成了新的系统。其中的七套系统是在 2011 到 2013 年期间安装的,只有三套系统是在 2015 年新安装的。世界 TOP500 的发展仍然处于从 2008

年开始的低潮阶段。国防科大研制的

图1 中国高性能计算机年度性能发展趋势 (2003-2015)

Fig. 1 Performance development trend of China HPC T0P100 (2003-2015.11)

85

表1 中国 TOP100 排行榜 TOP10 (2015.11)

Table 1 2015 China HPC TOP10 (2015.11)序号

研制厂商

型号

天河二号/MilkyWay-2/TH-IVB-FEP Cluster, 16000x2 Intel Xeon E5-2692 12C 2.2GHz, 16000x3 Intel Xeon Phi 31S1P/TH

Express-2私有高速网络 天河一号A/7168x2 Intel Hexa Core Xeon X5670 2.93GHz + 7168 Nvidia Tesla [email protected]+2048 Hex Core FT-1000@1GHz/私有高速

网络80Gbps 天河二号A/1792x IntelXeon E5-3

国防科大

2692 + 2688 Intel Phi 31S1P/TH

Express-2神威蓝光/8575x16 Core 申威1600@975MHz/QDR Infi niband 天河一号A-HN/2048x2 Intel Hexa Core Xeon X5670 2.93GHz + 2048 Nvidia Tesla [email protected]/私有高速网络

80Gbps 曙光星云/

Dawning TC3600 Blade/2560x (2 Intel Hexa Core X5650 + Nvidia Tesla C2050 GPU)/

QDR Infi niband

曙光硅立方/TC4600-LP液冷刀片/2076*Intel Xeon E5-2680v3/

FDR Infi niband 浪潮TS10000/Intel Xeon E5-2698v3 16C 2.3/1.9GHz, 10Gigabit Ethernet浪潮TS10000/Intel Xeon E5-2650v2 8C 2.6GHz, 10Gigabit

Ethernet, Tesla K40M曙光TC6000/6600*Intel Xeon E5-2450v2/10GbE

中科院大气物理

研究所

安装地点

应用领域

Linpack 值(Gfl ops)

峰值(Gfl ops)

1 国防科大

国家超级计算广

州中心

超算中心33862700.0054902400.00

2国防科大

国家超级计算天

津中心

超算中心 2566000.00 4701000.00

山西吕梁云计算

中心国家超级计算济

南中心

超算中心[1**********]000

4

国家并行计算机工程技术研究中心

科学计算/工业 795900.00 1070160.00

5 国防科大

国家超级计算长

沙中心

科学计算/教育 771700.00 1343200.00

6 曙光

国家超级计算深

圳中心

超算中心 749200.00 1296320.26

7曙光

科学计算[1**********]0

8浪潮

北京某网络公司 互联网服务/大数据[1**********]00

9 浪潮

浙江某网络公司 互联网服务/大数据[1**********]52

10曙光

某互联网公司互联网服务[1**********]00

天河 2 号超级计算机,以 33.86 PFlops 的 Linpack 性能,毫无悬念的蝉联了第六次世界 TOP500 冠军。目前世界上共有 81 套系统突破了 Linpack 千万亿次大关。中国 TOP100 排行榜第一名的位置连续第三次被86

国防科大制造并安装在国家超级计算广州中心的天河-2 号夺得。部署在国家超算天津中心的天河 1A ,以 2.56 PFlops 的 Linpack 性能位居第二名,其世界排名也降为第二十六名。部署在山西吕梁云计算

中心的天河二号,以 2.07PFlops 的性能,勇夺全国第三名,其世界排名为 34 名。目前中国国内共有 52 套系统突破了峰值千万亿次大关,但只有 3 套系统的 Linpack 突破千万亿次大关。中国高性能计算的发展仍然处于缓慢发展期,第一名性能仍然停滞不前。相信这个停滞期会随着神威 100P 新系统的发布被打破。

• 进入 2015 年 11 月份世界 TOP500 机器的 Linpack 性能都超过了 206.3 Tfl ops ;进入 2015 年中国 TOP100 机器的 Linpack 性能都超过了 360 TFlops,中国排行榜的上榜门槛再次超过世界 TOP500,且差距在持续拉大。中国 TOP100 中仍然有 96 个系统是机群,机群体系架构的数量继续保持绝对数量优势。值得注意的是,中国 TOP100 中性能比较高的系统,往往采用机群加 GPGPU 或 MIC 的异构体系结构,尤其是前 10 名里,6 台是此类系统。

• 世界 TOP500 中 TOP 10 的最低性能都超过 5.1PFlops ;其中 5 台由 Cray 公司制造,IBM 公司 2 台,国防科大、富士通公司和 Dell 公司各 1 台。高端能力超算 (TOP10) 的研制呈现出百花齐放的局面,各家都在积极占领制高点, 但美国公司尤其是 Cray 公司优势明显。目前只有 2 套机群系统进入 TOP 10。中国 TOP100 中,TOP 10 的最低性能大于 658 Tfl ops ,其中 4 台由国防科大制造,曙光 3 台,浪潮 2 台,神威 1 台。国产机器包揽了前 10 名。

• 世界 TOP500 上的 445 套系统使用 Intel 处理器。104 套系统采用加速部件加速 (其中 66 套采用 Nvidia 的 GPU,27 套系统采用 Intel Xeon Phi 处理器) 。中国 TOP100 中有 15 套系统采用了 GPU/MIC 加速,比 2014 年的 7 套大幅度上升,其中的 4 套系统采用了 Intel Xeon Phi 处理器。

• 亚洲国家在世界 TOP500 上的机器数量有大幅度提高,从 120 台猛升为 173 台。排行榜中有来自中国大陆的 109 套系统, 总数继续列亚洲第一,世界第二;来自日本的 37 套系统。虽然中国的数量排名世界第二,但我们应该清醒的认识到,其中绝大部分的机器并非应用在传统的科学计算应用,而是新兴的互联网应用。

• 目前中国 TOP100 排行榜中机器的平均 Linpack

性能 850 Tfl ops ,是 2014 年 684.8 Tfl ops 的 1.24 倍,增速小幅回升。2015 年国际 TOP500 排行榜中机器的平均 Linpack 性能为 840 Tflops ,国内和国际排行榜的平均性能双双首次超过 800 Tflops 但是中国 TOP100 略高。出现跨越式发展的主要原因是我国发布的天河二号一台超级计算机的 Linpack 性能就占到了中国 TOP100 的总性能的近 50%。如何用好天河二号,发挥其巨大的计算能力,成为未来 2 到 3 年中国超级计算行业面临的挑战性问题。

3 制造商分析

我们在图 2 中给出了中国 TOP100 制造商的上榜机器数量份额图。

2015 年中国 TOP100 排行榜上国内外厂商的上榜机器数量份额,变化不是很大,美国厂商制造的机器数量急剧下降到装机总数的 3%,跌到历史最低点,与国内厂商的 97% 份额差距明显,国产超算在国内市场已经占据主导地位。国产机器的市场份额主要被曙光、联想和浪潮三家瓜分,上榜厂商的数量与比 2014 年少一家,曙光公司已经连续七年保持中国 TOP100 数量份额第一名的位置。国外的上榜厂商继续保持二家,数量份额名次变为 IBM 和 HP。联想公司第二次与曙光公司并列中国 TOP100 数量份额第一名。HP 公司从曾经的中国 TOP100 排行榜连续多年的冠军,变成目前仅仅有一套系统在榜单上,历史的变化让人不胜唏嘘。当然,这与其在世界 TOP500 排行榜上的冠

军位置,是极其不对称的,其中原因值得分析。

图2 中国 TOP100 制造商机器数量份额图 (2015.11)

Fig. 2 China TOP100 vendor system sharing (2015.11)

87

从 2015 年中国 TOP100 排行榜上国内外厂商的上榜机器性能份额图 3 来看,中国 TOP100 总性能第一名的位置仍然由国防科大夺占据,接近总性能的一半。曙光公司、联想公司和浪潮公司分列第二到第四名,差别不到 5%。但是国产厂商的总性能超过了总性能的 95%。从数量和性能上都占据了压倒性的优势地位。

图 4 给出的是从 2003 年到 2015 年中国 TOP100 国内外厂商系统份额的趋势变化情况。

总体从装机数量上,前三名分别是曙光 (34%),比 2014 年上升 2%,连续七次取得第一名;联想 (34%) 与曙光再次并列第一;而浪潮 (23%) 再次夺得第三名,份额有小幅度提升。IBM (2%) 和 HP (1%)份额进一步下滑,几乎要在中国 TOP100 榜单上消失。华为公司作为 HPC 厂商第一次出现在 2014 年的 TOP100 上,但是 2015 年很快从榜单上消失,说明其在中国 HPC 市场尚未找到自己的位置。曙光和联想 (IBM) 公司虽然夺得机器总数量的并列第一名,但其机器总性能远低于国防科大,说明机器规模仍然偏小。曙光公司连续七年保持总数量份额的第一名,实属不易,其对高性能计算机市场多年耕耘,继续产生回报,做为第一家以 HPC 为主营业务上市的高科

图3 中国 TOP100 制造商机器性能份额图 (2015.11)

Fig. 3 China TOP100 manufacturing opportunities share

performance figure (2015.11)

技厂商,在三国大战中,如何继续维持其领先的位置,值得商榷。国防科大连续八年保持排行榜冠军的位置,足以证明其在高性能计算机研制技术上的多

图4 中国 TOP100 国内外厂商系统份额趋势 (2003-2015)

Fig. 4

China TOP100 vendor system sharing development trends (2003-2015)

88

年积累很深厚,但其机器的数量只有四套,在产业化和技术推广上,还有很长的路要走。联想公司通过对 IBM 公司 X86 HPC 产品线的并购,第二次在机器数量份额上取得与曙光并列第一的成绩。目前的中国超算市场初步形成了曙光,联想和浪潮三足鼎立的格局,且占据 95% 以上的份额,国外厂商在 HPC 领域逐渐退出中国市场。这与其在 TOP500 上的表现是极其不相称的。国外厂商如何重返中国市场或者国产厂商是否积极走出国门,开始国际化的征程,值得期待。

图5 中国 TOP100 行业应用领域机器系统份额图 (2015.11)

Fig. 5

China TOP100 application field system sharing (2015.11)

4 行业领域分析

为便于对比分析,我们在图 5 和图 6 分别给出了 2015 年中国 TOP100 中的行业应用领域的系统数量份额图和系统性能份额图。

从 2015 年 11 月发布的中国 TOP100 的行业应用领域来看,2015 年国内高性能计算主要分布在互联网服务、大数据、电信、云计算、政府部门、超算中心、科学计算、电子商务、视频、电力、信息安全、移动互联网、大气气象、工程、能源等十五个领域。领域数量有所增加。互联网服务继续保持份额排名第一的位置,但是由于把大数据单独列出,其份额有较大程度的下降,但是两者之和还是超过了 40%。这与中国互联网公司的快速崛起和大数据中的深度学习算法的广泛应用有很大关系,互联网公司通过深度学习算法重新发现了超级计算机特别是 GPU 加速的异构超级计算机的价值,纷纷投入巨资建设新系统。国内的几大主要应用领域是互联网服务、超算中心、大数据、电信、云计算和政府部门等。国内最为突出的特点是互联网服务和大数据应用异军突起,份额继续保持排行榜的第一位,成为国际上继游戏之后,另外一道中国独有的应用现象。

2015 年中国 TOP100,从机器数量上看,互联网服务 (24%,保持第一,大幅下降 31%)、大数据 (17%,首次列入领域分类) 、电信 (9%,重新闯入前三名,再次活跃) 、云计算 (8%,首次闯入前五名) 、政府部门 (7%,小幅下降,保持前五名) 。

图6 中国 TOP100 行业应用领域机器性能份额图 (2015.11)

Fig. 6 China TOP100 machine performance in industry applications (2015.11)

综合来看,目前的互联网服务、超算中心、大数据、云计算、电信和政府部门等领域是高性能计算的主要用户。互联网服务增长强劲,大数据、电子商务、移动互联网、信息安全等新应用领域在 2015 中国 TOP100 上首次出现。

根据历年积累的数据,我们在图 7 中给出了中国 TOP100 从 2003 年到 2015 年的应用领域趋势图。

如果按产学研三个大领域粗略划分,学主要是指教育,研主要是指科研机构 (超算中心、大气气象、生物信息、科学计算等) ,其他的都算作产业,那么 2015 年产学研三者的数量分别为 85:2:13。目前产业的份额占据了 2015 年 TOP100 排行榜的 87%,三

89

图7 中国 TOP100 应用领域趋势 (2003-2015)

Fig. 7 China TOP100 application trends (2003-2015)

者之间比例关系与 2014 年相比变化不大。但是一个比较明显的趋势是国家超算中心的机器有向高校转移的趋势,特别是国家超算广州的机器划归中山大学,国家超算长沙的机器划归湖南大学是 2015 年发生的两件比较有影响的事情。据说,国家超算无锡中心的机器也有与高校合作共建的意向。高性能计算教育的超算环境一直在较低的数量徘徊,降低到只有两套依托高校共建的国家超算中心在榜上。科研机构的超算系统数量有小幅度的增加。但是,超算中心的机器数量份额虽然只达到了 6%,但其性能份额仍然排名第一,说明国家对国家超算中心的投入在 2015 年随着两套 100PFlops 超算系统的升级和研制接近完成,产生了更多的影响和效果。2015 年,受美国商务部限售令的影响,国家超算广州中心没有按原计划完成升级计划,推迟到了 2016 年底完成,但这并未影响天河 2 号系统连续六次夺得世界冠军;国家超算无锡中心的 100P 超级计算机系统原计划在 2015 年底前投入90

运营,也因为种种原因被迫推迟,预计在 2016 年会正式上线运营,届时该系统很有可能取代天河 2 号夺得世界超算 TOP500 的冠军。中国超算军团,将首次在世界舞台上实现交替领跑。目前世界上的美日欧等国家和地区都已经公开发布了其未来的 E 级超级计算系统的研制计划,几乎都希望在 2020 年到 2024 年之间发布 E 级系统,夺取世界第一。中国的十三五规划在经历科技部的科研管理体制的改革之后,国家已经明确了对研制 E 级系统的支持,超级计算系统的专项将作为十三五首批启动的科技专项,在 2016 年上半年发布指南。

5 展望

综合从 2003 年开始的中国大陆高性能计算机 TOP100 排行榜机器的第一名 Linpack 性能,第一名峰值性能和总性能,我们得到了图 1

中的中国高性能

计算机性能发展趋势图 (2003-2015)。从图中的数据可以看出,中国高性能计算机的研制和生产也是有一定规律的。从 2003 年到 2005 年,中国超算的发展经历了一次快速发展时期,这个发展期维持到 2005 年 (3 年) ,然后在 2005 年开始进入一个平稳发展期。而 2007 年排行榜第一名性能的小幅增长,是一个信号,说明大陆地区开始走出平稳发展期,进入新一轮快速发展期。2008 年百万亿次机器的出现,证实了我们之前的观察。2009 年千万亿次天河一号的提前横空出世,颠覆了我们之前的 2010 年底或 2011 年初发布峰值千万亿次国产机器的预言。2010 年 11 月,天河一号 A 登顶世界 TOP500 第一名,将作为这个从 2008 年开始的超算发展活跃期的一个休止符。直到 2012 年天河一号 A 再夺国内 TOP100 第一,标志着我国超算的研制仍然维持在平稳发展期,这个周期在 2013 年被天河 2 号的出现结束。2013 年 6 月,天河 2 号帮助中国再夺世界第一且连续六次蝉联世界第一和连续三次蝉联中国 TOP100 第一,说明中国超算发展在短暂进入活跃期后,再次进入平稳发展期。这个平稳发展期本来应该在 2015 年结束,但是由于限售时间的影响,推迟到 2016 年结束。

从第一名的峰值性能趋势预测可以看出,根据新收集的数据,可以得到的新预测结果是:累计 Linpack 性能将在 2014 年到 2015 年间达到 100 Petaflops (由于限售令,没有按期实现,预期 2016 年实现) ;峰值 100 Petafl ops 的机器将在 2015 年左右出现 (由于限售令,没有按期实现,预计 2016 年实现) ,100 Petaflops Linpack 性能的机器将在 2016 年到 2017 年出现,累计 Linpack 性能将在 2017 年到 2018 年间达到 1000 Petaflops。峰值 Exaflops 的机器将在 2018 年到 2019 年间出现[5-6]。

综上所述,2015 年的 TOP100 排行榜主要体现了以下几个趋势:(1) 国防科大连续八年蝉联中国 TOP100 第一名并再次夺得性能份额第一名;(2) 曙光公司连续七年保持中国 TOP100 数量份额第一名;(3) 联想公司通过对 IBM 公司 X86 HPC 产品线和品牌的并购和整合,再次与曙光公司并列数量份额第一名;(4) TOP100 总体性能突破 85 PFlops,中国高性能计

算市场的增速放缓;(5) TOP100 平均性能突破 850 万亿次,小幅超过国际 TOP500 的平均性能 840 万亿次,继续领先国际平均水平且双双突破 800 万亿次大关;(6) 入门系统性能门槛继续大幅提升,达到 360 TFlops,再次大幅度超过国际 TOP500 的入门系统性能 206 TFlops;(7) 96 套系统采用机群结构,计算机体系结构创新形势依然严峻;(8) 国产 16 核申威 1600 处理器仍然只占据 1% 的处理器份额,虽然打破了国外处理器垄断 TOP100 排行榜的坚冰,但仍然没有新的增长;(9) NUDT 国产私有高性能网络占据 4% 的高速互联网络份额,没有继续扩大国产高性能互联网络的份额趋势;(10) 上榜高性能计算机制造商仍然保持 8 家,市场份额进一步集中在国产厂商,曙光、联想和浪潮三家厂商就占据了 91% 的数量份额;(11) 应用领域进一步小幅上升到 15 个,高性能计算应用特别是在互联网服务领域继续呈现百花齐放局面。互联网服务、大数据、超算中心、电信、云计算和政府部门等是高性能计算主要用户。

展望 2016 年,国家超算无锡中心的 100P 全国产神威超级计算机能否如期发布并取代天河二号夺取世界第一,是最值得期待的话题。天河二号能否如期在 2016 年完成从 55 PFlops 升级到 110 PFlops 的计划,并再次凭借中国加速部件夺取世界第一,令人充满期待。两套国产 100P 系统隆重上线发布,正式投入服务,能否支撑国产超算应用取得新的更大突破和进展,并夺得贝尔•戈登奖 (Gordon Bell prize),让我们拭目以待。

参考文献

[1] Hans Meuer, Horst Simon, E. Strohmaier,Jack Dongarra,

TOP500 Supercomputer Sites[OL], http://www.top500.org.

[2] 张云泉, 孙家昶, 袁国兴, 张林波, 中国高性能计算机

TOP100 排行榜[OL], http://www.samss.org.cn.

[3] Jack Dongarra, An Overview of High Performance

Computing and Challenges for the Future[OL], San Diego, CA, USA: SIAM. [2008-07-07] http://www.netlib.org/utk/

91

Zhang Linbo. Perspectives of China ’s HPC system development: a view from the 2009 China HPC TOP100 list. China: Frontiers of Computer Science in China, 2010. 437-444.

people/JackDongarra/SLIDES/siam-0708.pdf .

[4] Antoine Petitet, Clint Whaley, Jack Dongarra, Andy

Cleary, HPL Benchmark 2.0[OL], http://netlib.org/benchmark/hpl/.

[5] Yunquan Zhang, Jiachang Sun, Guoxing Yuan and Linbo

Zhang, A Brief Introduction to China HPC TOP100: from 2002 to 2006, Workshop on High Performance Computing in China: Solution Approaches to Impediments for High Performance Computing, Supercomputing 2007, 10-16, Nov., 2007, Reno, NV, USA,32-36.

[6] Zhang Yunquan, Sun Jiachang, Yuan Guoxing, and

收稿日期:2015 年 11 月 15 日

张云泉:中国科学院计算技术研究所计算机体系结构国家重点实验室,博士,研究员,博士生导师,主要研究领域为并行算法与并行软件。E-mail: [email protected]

92

科研信息化技术与应用2015, 6(6) : 83–92

NEWS & VIEWS··资讯观察 /

2015 年中国高性能计算机发展现状分析与展望

张云泉

中国科学院计算技术研究所 计算机体系结构国家重点实验室,北京 100190

摘  要:

本文根据 2015 年 11 月发布的中国高性能计算机 TOP100 排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。我们发现,由于国际超算发展态势整体放慢,中国 TOP100 的平均 Linpack 性能和入门门槛继续保持比国际 TOP500 高的局面。随着联想对 IBM X86 服务器并购的完成,中国 TOP100 上的超级计算系统几乎 90% 以上都是国产超算系统,曙光、联想和浪潮三强争霸的局面已经形成。安装在中国大陆的超算系统在 2015 年 11 月 TOP500 上的数量再创新高,紧跟美国之后排名世界第二;而中科曙光生产的超算系统更是历史性的首次闯入世界前三强,排名 HP 和 Cray 之后。中国的超算系统研制水平和能力经过十多年的快速发展,已经跻身世界先进水平的行列。在此基础上,根据十四届排行榜积累的性能数据,我们对未来几年中国大陆高性能计算机的发展趋势进行了分析预测。我们认为:峰值 100Petafl ops 的机器将在 2016 年出现,100Peta fl ops Linpack 性能的机器将在 2016 年到 2017 年出现,累计 Linpack 性能将在 2017 年到 2018 年间达到 1000Petafl ops ,峰值 Exafl ops 的机器将在 2018 年到 2019 年间出现。

关键词:高性能计算机;TOP100;排行榜;性能;分析

doi: 10.11871/j.issn.1674-9480.2015.06.010

State-of-Art Analysis and Perspectives of 2015 China HPC

Zhang Yunquan

State Key Laboratory of Computer Archintecture, Institute of Computing Technology, Chinese Academy of Sciences, Beijing, 100190, ChinaAbstract:

In this paper, according to China HPC TOP100 rank list published in November 2105, the performance,

基金项目:国家高技术研究发展计划 (863 计划) (2006AA01A105)

83

manufacturer, and application area of 2015 China TOP100 supercomputers are analyzed in detail. It shows that the average Linpack performance of China TOP100 surpasses again the average of world TOP500 supercomputers. Over 90% of these HPC systems are manufactured in China, and Sugon, Lenovo, and Inspur are the dominate manufacturers. The total number of world TOP500 HPCs located in China again increases to the No.2 in the world, following the US. Sugon becomes one of the top three supercomputer manufacturers in the world, following HP and Cray. Based on the public available historical data and the data of peak performance in previous 14 China HPC TOP100 lists, it could predicted that in China the supercomputer system with peak Linpack performance 100 petaflops would appear between 2016 and 2017, the total Linpack performance of China TOP100 would surpass 1000 petaflops between 2017 and 2018, and the Exaflops supercomputer would appear between 2018 and 2019 in China.

Keywords:high performance computer; TOP100; rank list; performance; analysis

1 背景

在国际上,自 1993 年起每年都会按 Linpack 的测试性能公布在世界范围内已安装的前 500 台高性能计算机排行 [1],成为高性能计算机研制生产、市场发展、应用交流和趋势分析预测的重要参考。在 2002 年之前,我国的高性能计算机未曾向国际申报 Linpack 性能测试结果,故而未列入国际 TOP500 排行榜。在中国软件行业协会数学软件分会发布首次中国高性能计算机排行榜的 2002 年当年,就实现了零的突破。在中国 TOP50 排行榜中名列第一的联想深腾 1800 万亿次机群名列 2002 年世界 TOP500 第 43 名,结束了在世界 TOP500 排行榜没有国产高性能计算机的历史。2003 年,在中国 TOP100 排行榜中名列第一的联想深腾 6800 万亿次机群名列 2003 年世界 TOP500 第 14 名,达到了国产高性能计算机的历史新高。2004 年,在中国 TOP100 排行榜中名列第一的曙光 4000A 更是取得了 6 月份 TOP500 排行榜世界第十的历史性突破,引起世界关注。在 2005 年,中国 TOP100 的第一名自发布以来首次被国外厂商夺走,但国产计算机所占的份额却首次赶超国外计算机,国产计算机亦喜亦忧。由于处于发展的平台期,2006 和 2007 年中国 TOP100 排行榜让人开始为国产并行机担忧了,不但第一名的位置未夺回,所占份额维持在 40% 左右,未见增长。在国家“十一五”863 计划的“高效能计算机与网格软件”重大专项里部署84

了研制更大规模的 Petafl ops 的高性能计算机的课题,并在 2008 年底推出了峰值超过百万亿次的两台国产高效能计算机。我们在2008年发布的中国 TOP100 排行榜中看到了国家 863 项目对改变国产高性能计算机现状的显著推动作用。2009 年,这一推动效果更加明显,2009 年 10 月发布的国产天河一号千万亿次超级计算机以 563.1TFlops 的 Linpack 性能名列 2009 年 11 月国际 TOP500 排行榜的第 5 名,是国产超级计算机首次进入世界前五名,取得了历史新高。2010 年 9 月发布的国产天河一号 A 千万亿次超级计算机通过采用先进的 CPU+GPGPU 的异构混合加速体系架构,以 2.56PFlops 的 Linpack 性能夺取 2010 年 11 月国际 TOP500 排行榜的第一名, 是中国国产超级计算机首次夺得世界冠军;我国安装的超级计算机的上榜数量也首次超越日本和欧盟, 排名世界第二,仅次于美国,标志着我国超级计算机硬件的研制水平达到国际领先水平。但是,美日欧等国从不甘心将世界第一的位置长久的让中国国产超级计算机占据,仅仅在 2011 年起不到 2 年的时间里,日本和美国先后投入巨资研制成功京速机、红杉和 Titan,先后重新夺取了三次世界第一的位置。2013 年,我国的高性能计算机科研工作者戒骄戒躁,刻苦攻关,勇攀高峰,于 2013 年 6 月凭借由国防科大研制的天河 2 号超级计算机,再次夺取世界 TOP500 第一名。迄今为止,中国研制的天河系列超级计算机已经七次夺取世界第一名,天河二号更是取得了六连冠的辉煌成绩,牢牢占

稳了中国在世界 TOP500 超级计算机冠军俱乐部中的位置。此外,安装在中国大陆的超算系统在 2015 年 11 月 TOP500 上的数量猛升三倍达到 109 套,再创历史新高,紧跟美国之后排名世界第二,但是美国在 TOP500 上的超算系统数量降低到历史上的最低点;而中科曙光生产的超算系统更是历史性的首次闯入世界前三强,排名 HP 和 Cray 之后。超级计算系统作为计算科学的必备基础设施,已经成为国家之间的战略必争点和创新转型的利器,各国都投入巨资争夺世界制高点。中国的超算系统研制水平和能力经过十多年的快速发展,已经跻身世界先进水平的行列。美国虽然仍是世界超算的强国,但是其数量已经降低到不足 40% 的份额,难以恢复十年前独霸世界 TOP500 70% 系统的盛况。

此次测评按国际惯例选用 Linpack 测试 (HPL) [4],2008 年 9 月底发布最新的 2.0 版本。本文给出对中国软件行业协会数学软件分会联合国家 863 高性能计算机评测中心和中国计算机学会高性能计算专委会于 2015 年 11 月发布的中国高性能计算机性能 TOP100 排行榜 [1] 数据的深入分析与展望。文中的图表数据

主要来源于中国 HPC TOP100。以下将中国 HPC TOP100 简称中国 TOP100[2]。

2 总体性能分析

本节图 1 和表 1 分别给出的是中国 TOP100 的总体性能发展趋势图以及 TOP10 计算机情况的列表。

和 2015 年 11 月发布的世界 TOP500 高性能计算机的情况相比较,可以看到:

• 2015 年 11 月世界 TOP500 总 Linpack 性能达到了 418.3PFlops,是 2014 年 309 PFlops 的 1.35 倍,增速继续变慢;而根据 2015 年中国 TOP100 排行榜的数据,中国 TOP100 的总 Linpack 性能是 85.1PFlops ,是 2014 年 68.6PFlops 的 1.24 倍,增速较 2013 年的 1.2 倍缓慢上升。

世界 TOP500 的前十名系统,几乎没有什么太大变化,仅仅第六名和第八名换成了新的系统。其中的七套系统是在 2011 到 2013 年期间安装的,只有三套系统是在 2015 年新安装的。世界 TOP500 的发展仍然处于从 2008

年开始的低潮阶段。国防科大研制的

图1 中国高性能计算机年度性能发展趋势 (2003-2015)

Fig. 1 Performance development trend of China HPC T0P100 (2003-2015.11)

85

表1 中国 TOP100 排行榜 TOP10 (2015.11)

Table 1 2015 China HPC TOP10 (2015.11)序号

研制厂商

型号

天河二号/MilkyWay-2/TH-IVB-FEP Cluster, 16000x2 Intel Xeon E5-2692 12C 2.2GHz, 16000x3 Intel Xeon Phi 31S1P/TH

Express-2私有高速网络 天河一号A/7168x2 Intel Hexa Core Xeon X5670 2.93GHz + 7168 Nvidia Tesla [email protected]+2048 Hex Core FT-1000@1GHz/私有高速

网络80Gbps 天河二号A/1792x IntelXeon E5-3

国防科大

2692 + 2688 Intel Phi 31S1P/TH

Express-2神威蓝光/8575x16 Core 申威1600@975MHz/QDR Infi niband 天河一号A-HN/2048x2 Intel Hexa Core Xeon X5670 2.93GHz + 2048 Nvidia Tesla [email protected]/私有高速网络

80Gbps 曙光星云/

Dawning TC3600 Blade/2560x (2 Intel Hexa Core X5650 + Nvidia Tesla C2050 GPU)/

QDR Infi niband

曙光硅立方/TC4600-LP液冷刀片/2076*Intel Xeon E5-2680v3/

FDR Infi niband 浪潮TS10000/Intel Xeon E5-2698v3 16C 2.3/1.9GHz, 10Gigabit Ethernet浪潮TS10000/Intel Xeon E5-2650v2 8C 2.6GHz, 10Gigabit

Ethernet, Tesla K40M曙光TC6000/6600*Intel Xeon E5-2450v2/10GbE

中科院大气物理

研究所

安装地点

应用领域

Linpack 值(Gfl ops)

峰值(Gfl ops)

1 国防科大

国家超级计算广

州中心

超算中心33862700.0054902400.00

2国防科大

国家超级计算天

津中心

超算中心 2566000.00 4701000.00

山西吕梁云计算

中心国家超级计算济

南中心

超算中心[1**********]000

4

国家并行计算机工程技术研究中心

科学计算/工业 795900.00 1070160.00

5 国防科大

国家超级计算长

沙中心

科学计算/教育 771700.00 1343200.00

6 曙光

国家超级计算深

圳中心

超算中心 749200.00 1296320.26

7曙光

科学计算[1**********]0

8浪潮

北京某网络公司 互联网服务/大数据[1**********]00

9 浪潮

浙江某网络公司 互联网服务/大数据[1**********]52

10曙光

某互联网公司互联网服务[1**********]00

天河 2 号超级计算机,以 33.86 PFlops 的 Linpack 性能,毫无悬念的蝉联了第六次世界 TOP500 冠军。目前世界上共有 81 套系统突破了 Linpack 千万亿次大关。中国 TOP100 排行榜第一名的位置连续第三次被86

国防科大制造并安装在国家超级计算广州中心的天河-2 号夺得。部署在国家超算天津中心的天河 1A ,以 2.56 PFlops 的 Linpack 性能位居第二名,其世界排名也降为第二十六名。部署在山西吕梁云计算

中心的天河二号,以 2.07PFlops 的性能,勇夺全国第三名,其世界排名为 34 名。目前中国国内共有 52 套系统突破了峰值千万亿次大关,但只有 3 套系统的 Linpack 突破千万亿次大关。中国高性能计算的发展仍然处于缓慢发展期,第一名性能仍然停滞不前。相信这个停滞期会随着神威 100P 新系统的发布被打破。

• 进入 2015 年 11 月份世界 TOP500 机器的 Linpack 性能都超过了 206.3 Tfl ops ;进入 2015 年中国 TOP100 机器的 Linpack 性能都超过了 360 TFlops,中国排行榜的上榜门槛再次超过世界 TOP500,且差距在持续拉大。中国 TOP100 中仍然有 96 个系统是机群,机群体系架构的数量继续保持绝对数量优势。值得注意的是,中国 TOP100 中性能比较高的系统,往往采用机群加 GPGPU 或 MIC 的异构体系结构,尤其是前 10 名里,6 台是此类系统。

• 世界 TOP500 中 TOP 10 的最低性能都超过 5.1PFlops ;其中 5 台由 Cray 公司制造,IBM 公司 2 台,国防科大、富士通公司和 Dell 公司各 1 台。高端能力超算 (TOP10) 的研制呈现出百花齐放的局面,各家都在积极占领制高点, 但美国公司尤其是 Cray 公司优势明显。目前只有 2 套机群系统进入 TOP 10。中国 TOP100 中,TOP 10 的最低性能大于 658 Tfl ops ,其中 4 台由国防科大制造,曙光 3 台,浪潮 2 台,神威 1 台。国产机器包揽了前 10 名。

• 世界 TOP500 上的 445 套系统使用 Intel 处理器。104 套系统采用加速部件加速 (其中 66 套采用 Nvidia 的 GPU,27 套系统采用 Intel Xeon Phi 处理器) 。中国 TOP100 中有 15 套系统采用了 GPU/MIC 加速,比 2014 年的 7 套大幅度上升,其中的 4 套系统采用了 Intel Xeon Phi 处理器。

• 亚洲国家在世界 TOP500 上的机器数量有大幅度提高,从 120 台猛升为 173 台。排行榜中有来自中国大陆的 109 套系统, 总数继续列亚洲第一,世界第二;来自日本的 37 套系统。虽然中国的数量排名世界第二,但我们应该清醒的认识到,其中绝大部分的机器并非应用在传统的科学计算应用,而是新兴的互联网应用。

• 目前中国 TOP100 排行榜中机器的平均 Linpack

性能 850 Tfl ops ,是 2014 年 684.8 Tfl ops 的 1.24 倍,增速小幅回升。2015 年国际 TOP500 排行榜中机器的平均 Linpack 性能为 840 Tflops ,国内和国际排行榜的平均性能双双首次超过 800 Tflops 但是中国 TOP100 略高。出现跨越式发展的主要原因是我国发布的天河二号一台超级计算机的 Linpack 性能就占到了中国 TOP100 的总性能的近 50%。如何用好天河二号,发挥其巨大的计算能力,成为未来 2 到 3 年中国超级计算行业面临的挑战性问题。

3 制造商分析

我们在图 2 中给出了中国 TOP100 制造商的上榜机器数量份额图。

2015 年中国 TOP100 排行榜上国内外厂商的上榜机器数量份额,变化不是很大,美国厂商制造的机器数量急剧下降到装机总数的 3%,跌到历史最低点,与国内厂商的 97% 份额差距明显,国产超算在国内市场已经占据主导地位。国产机器的市场份额主要被曙光、联想和浪潮三家瓜分,上榜厂商的数量与比 2014 年少一家,曙光公司已经连续七年保持中国 TOP100 数量份额第一名的位置。国外的上榜厂商继续保持二家,数量份额名次变为 IBM 和 HP。联想公司第二次与曙光公司并列中国 TOP100 数量份额第一名。HP 公司从曾经的中国 TOP100 排行榜连续多年的冠军,变成目前仅仅有一套系统在榜单上,历史的变化让人不胜唏嘘。当然,这与其在世界 TOP500 排行榜上的冠

军位置,是极其不对称的,其中原因值得分析。

图2 中国 TOP100 制造商机器数量份额图 (2015.11)

Fig. 2 China TOP100 vendor system sharing (2015.11)

87

从 2015 年中国 TOP100 排行榜上国内外厂商的上榜机器性能份额图 3 来看,中国 TOP100 总性能第一名的位置仍然由国防科大夺占据,接近总性能的一半。曙光公司、联想公司和浪潮公司分列第二到第四名,差别不到 5%。但是国产厂商的总性能超过了总性能的 95%。从数量和性能上都占据了压倒性的优势地位。

图 4 给出的是从 2003 年到 2015 年中国 TOP100 国内外厂商系统份额的趋势变化情况。

总体从装机数量上,前三名分别是曙光 (34%),比 2014 年上升 2%,连续七次取得第一名;联想 (34%) 与曙光再次并列第一;而浪潮 (23%) 再次夺得第三名,份额有小幅度提升。IBM (2%) 和 HP (1%)份额进一步下滑,几乎要在中国 TOP100 榜单上消失。华为公司作为 HPC 厂商第一次出现在 2014 年的 TOP100 上,但是 2015 年很快从榜单上消失,说明其在中国 HPC 市场尚未找到自己的位置。曙光和联想 (IBM) 公司虽然夺得机器总数量的并列第一名,但其机器总性能远低于国防科大,说明机器规模仍然偏小。曙光公司连续七年保持总数量份额的第一名,实属不易,其对高性能计算机市场多年耕耘,继续产生回报,做为第一家以 HPC 为主营业务上市的高科

图3 中国 TOP100 制造商机器性能份额图 (2015.11)

Fig. 3 China TOP100 manufacturing opportunities share

performance figure (2015.11)

技厂商,在三国大战中,如何继续维持其领先的位置,值得商榷。国防科大连续八年保持排行榜冠军的位置,足以证明其在高性能计算机研制技术上的多

图4 中国 TOP100 国内外厂商系统份额趋势 (2003-2015)

Fig. 4

China TOP100 vendor system sharing development trends (2003-2015)

88

年积累很深厚,但其机器的数量只有四套,在产业化和技术推广上,还有很长的路要走。联想公司通过对 IBM 公司 X86 HPC 产品线的并购,第二次在机器数量份额上取得与曙光并列第一的成绩。目前的中国超算市场初步形成了曙光,联想和浪潮三足鼎立的格局,且占据 95% 以上的份额,国外厂商在 HPC 领域逐渐退出中国市场。这与其在 TOP500 上的表现是极其不相称的。国外厂商如何重返中国市场或者国产厂商是否积极走出国门,开始国际化的征程,值得期待。

图5 中国 TOP100 行业应用领域机器系统份额图 (2015.11)

Fig. 5

China TOP100 application field system sharing (2015.11)

4 行业领域分析

为便于对比分析,我们在图 5 和图 6 分别给出了 2015 年中国 TOP100 中的行业应用领域的系统数量份额图和系统性能份额图。

从 2015 年 11 月发布的中国 TOP100 的行业应用领域来看,2015 年国内高性能计算主要分布在互联网服务、大数据、电信、云计算、政府部门、超算中心、科学计算、电子商务、视频、电力、信息安全、移动互联网、大气气象、工程、能源等十五个领域。领域数量有所增加。互联网服务继续保持份额排名第一的位置,但是由于把大数据单独列出,其份额有较大程度的下降,但是两者之和还是超过了 40%。这与中国互联网公司的快速崛起和大数据中的深度学习算法的广泛应用有很大关系,互联网公司通过深度学习算法重新发现了超级计算机特别是 GPU 加速的异构超级计算机的价值,纷纷投入巨资建设新系统。国内的几大主要应用领域是互联网服务、超算中心、大数据、电信、云计算和政府部门等。国内最为突出的特点是互联网服务和大数据应用异军突起,份额继续保持排行榜的第一位,成为国际上继游戏之后,另外一道中国独有的应用现象。

2015 年中国 TOP100,从机器数量上看,互联网服务 (24%,保持第一,大幅下降 31%)、大数据 (17%,首次列入领域分类) 、电信 (9%,重新闯入前三名,再次活跃) 、云计算 (8%,首次闯入前五名) 、政府部门 (7%,小幅下降,保持前五名) 。

图6 中国 TOP100 行业应用领域机器性能份额图 (2015.11)

Fig. 6 China TOP100 machine performance in industry applications (2015.11)

综合来看,目前的互联网服务、超算中心、大数据、云计算、电信和政府部门等领域是高性能计算的主要用户。互联网服务增长强劲,大数据、电子商务、移动互联网、信息安全等新应用领域在 2015 中国 TOP100 上首次出现。

根据历年积累的数据,我们在图 7 中给出了中国 TOP100 从 2003 年到 2015 年的应用领域趋势图。

如果按产学研三个大领域粗略划分,学主要是指教育,研主要是指科研机构 (超算中心、大气气象、生物信息、科学计算等) ,其他的都算作产业,那么 2015 年产学研三者的数量分别为 85:2:13。目前产业的份额占据了 2015 年 TOP100 排行榜的 87%,三

89

图7 中国 TOP100 应用领域趋势 (2003-2015)

Fig. 7 China TOP100 application trends (2003-2015)

者之间比例关系与 2014 年相比变化不大。但是一个比较明显的趋势是国家超算中心的机器有向高校转移的趋势,特别是国家超算广州的机器划归中山大学,国家超算长沙的机器划归湖南大学是 2015 年发生的两件比较有影响的事情。据说,国家超算无锡中心的机器也有与高校合作共建的意向。高性能计算教育的超算环境一直在较低的数量徘徊,降低到只有两套依托高校共建的国家超算中心在榜上。科研机构的超算系统数量有小幅度的增加。但是,超算中心的机器数量份额虽然只达到了 6%,但其性能份额仍然排名第一,说明国家对国家超算中心的投入在 2015 年随着两套 100PFlops 超算系统的升级和研制接近完成,产生了更多的影响和效果。2015 年,受美国商务部限售令的影响,国家超算广州中心没有按原计划完成升级计划,推迟到了 2016 年底完成,但这并未影响天河 2 号系统连续六次夺得世界冠军;国家超算无锡中心的 100P 超级计算机系统原计划在 2015 年底前投入90

运营,也因为种种原因被迫推迟,预计在 2016 年会正式上线运营,届时该系统很有可能取代天河 2 号夺得世界超算 TOP500 的冠军。中国超算军团,将首次在世界舞台上实现交替领跑。目前世界上的美日欧等国家和地区都已经公开发布了其未来的 E 级超级计算系统的研制计划,几乎都希望在 2020 年到 2024 年之间发布 E 级系统,夺取世界第一。中国的十三五规划在经历科技部的科研管理体制的改革之后,国家已经明确了对研制 E 级系统的支持,超级计算系统的专项将作为十三五首批启动的科技专项,在 2016 年上半年发布指南。

5 展望

综合从 2003 年开始的中国大陆高性能计算机 TOP100 排行榜机器的第一名 Linpack 性能,第一名峰值性能和总性能,我们得到了图 1

中的中国高性能

计算机性能发展趋势图 (2003-2015)。从图中的数据可以看出,中国高性能计算机的研制和生产也是有一定规律的。从 2003 年到 2005 年,中国超算的发展经历了一次快速发展时期,这个发展期维持到 2005 年 (3 年) ,然后在 2005 年开始进入一个平稳发展期。而 2007 年排行榜第一名性能的小幅增长,是一个信号,说明大陆地区开始走出平稳发展期,进入新一轮快速发展期。2008 年百万亿次机器的出现,证实了我们之前的观察。2009 年千万亿次天河一号的提前横空出世,颠覆了我们之前的 2010 年底或 2011 年初发布峰值千万亿次国产机器的预言。2010 年 11 月,天河一号 A 登顶世界 TOP500 第一名,将作为这个从 2008 年开始的超算发展活跃期的一个休止符。直到 2012 年天河一号 A 再夺国内 TOP100 第一,标志着我国超算的研制仍然维持在平稳发展期,这个周期在 2013 年被天河 2 号的出现结束。2013 年 6 月,天河 2 号帮助中国再夺世界第一且连续六次蝉联世界第一和连续三次蝉联中国 TOP100 第一,说明中国超算发展在短暂进入活跃期后,再次进入平稳发展期。这个平稳发展期本来应该在 2015 年结束,但是由于限售时间的影响,推迟到 2016 年结束。

从第一名的峰值性能趋势预测可以看出,根据新收集的数据,可以得到的新预测结果是:累计 Linpack 性能将在 2014 年到 2015 年间达到 100 Petaflops (由于限售令,没有按期实现,预期 2016 年实现) ;峰值 100 Petafl ops 的机器将在 2015 年左右出现 (由于限售令,没有按期实现,预计 2016 年实现) ,100 Petaflops Linpack 性能的机器将在 2016 年到 2017 年出现,累计 Linpack 性能将在 2017 年到 2018 年间达到 1000 Petaflops。峰值 Exaflops 的机器将在 2018 年到 2019 年间出现[5-6]。

综上所述,2015 年的 TOP100 排行榜主要体现了以下几个趋势:(1) 国防科大连续八年蝉联中国 TOP100 第一名并再次夺得性能份额第一名;(2) 曙光公司连续七年保持中国 TOP100 数量份额第一名;(3) 联想公司通过对 IBM 公司 X86 HPC 产品线和品牌的并购和整合,再次与曙光公司并列数量份额第一名;(4) TOP100 总体性能突破 85 PFlops,中国高性能计

算市场的增速放缓;(5) TOP100 平均性能突破 850 万亿次,小幅超过国际 TOP500 的平均性能 840 万亿次,继续领先国际平均水平且双双突破 800 万亿次大关;(6) 入门系统性能门槛继续大幅提升,达到 360 TFlops,再次大幅度超过国际 TOP500 的入门系统性能 206 TFlops;(7) 96 套系统采用机群结构,计算机体系结构创新形势依然严峻;(8) 国产 16 核申威 1600 处理器仍然只占据 1% 的处理器份额,虽然打破了国外处理器垄断 TOP100 排行榜的坚冰,但仍然没有新的增长;(9) NUDT 国产私有高性能网络占据 4% 的高速互联网络份额,没有继续扩大国产高性能互联网络的份额趋势;(10) 上榜高性能计算机制造商仍然保持 8 家,市场份额进一步集中在国产厂商,曙光、联想和浪潮三家厂商就占据了 91% 的数量份额;(11) 应用领域进一步小幅上升到 15 个,高性能计算应用特别是在互联网服务领域继续呈现百花齐放局面。互联网服务、大数据、超算中心、电信、云计算和政府部门等是高性能计算主要用户。

展望 2016 年,国家超算无锡中心的 100P 全国产神威超级计算机能否如期发布并取代天河二号夺取世界第一,是最值得期待的话题。天河二号能否如期在 2016 年完成从 55 PFlops 升级到 110 PFlops 的计划,并再次凭借中国加速部件夺取世界第一,令人充满期待。两套国产 100P 系统隆重上线发布,正式投入服务,能否支撑国产超算应用取得新的更大突破和进展,并夺得贝尔•戈登奖 (Gordon Bell prize),让我们拭目以待。

参考文献

[1] Hans Meuer, Horst Simon, E. Strohmaier,Jack Dongarra,

TOP500 Supercomputer Sites[OL], http://www.top500.org.

[2] 张云泉, 孙家昶, 袁国兴, 张林波, 中国高性能计算机

TOP100 排行榜[OL], http://www.samss.org.cn.

[3] Jack Dongarra, An Overview of High Performance

Computing and Challenges for the Future[OL], San Diego, CA, USA: SIAM. [2008-07-07] http://www.netlib.org/utk/

91

Zhang Linbo. Perspectives of China ’s HPC system development: a view from the 2009 China HPC TOP100 list. China: Frontiers of Computer Science in China, 2010. 437-444.

people/JackDongarra/SLIDES/siam-0708.pdf .

[4] Antoine Petitet, Clint Whaley, Jack Dongarra, Andy

Cleary, HPL Benchmark 2.0[OL], http://netlib.org/benchmark/hpl/.

[5] Yunquan Zhang, Jiachang Sun, Guoxing Yuan and Linbo

Zhang, A Brief Introduction to China HPC TOP100: from 2002 to 2006, Workshop on High Performance Computing in China: Solution Approaches to Impediments for High Performance Computing, Supercomputing 2007, 10-16, Nov., 2007, Reno, NV, USA,32-36.

[6] Zhang Yunquan, Sun Jiachang, Yuan Guoxing, and

收稿日期:2015 年 11 月 15 日

张云泉:中国科学院计算技术研究所计算机体系结构国家重点实验室,博士,研究员,博士生导师,主要研究领域为并行算法与并行软件。E-mail: [email protected]

92


相关内容

  • 2015年薄膜太阳能电池现状及发展趋势分析
  • 2015年中国薄膜太阳能电池行业现状研究 分析与发展趋势预测报告 报告编号:1572320 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了解该行业整体发展态势及经济运行状况,旨在为企业或投 ...

  • 2016年伺服电机现状研究及发展趋势
  • 中国伺服电机行业发展现状分析与发展趋 势预测报告(2016-2020年) 报告编号:1891959 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了解该行业整体发展态势及经济运行状况,旨在为 ...

  • 中国集成电路行业未来规划及投资发展前景预测报告2016-2021年
  • 中国集成电路行业未来规划及投资发展前景预测报告2016-2021年 编制单位:北京智博睿投资咨询有限公司 [报告目录]: 第一章 集成电路基本情况 1.1 集成电路的相关介绍 1.1.1 集成电路定义 1.1.2 集成电路的分类 1.2 模拟集成电路 1.2.1 模拟集成电路的概念 1.2.2 模拟 ...

  • 2016年新型建材市场现状与发展趋势预测
  • 2016-2022年中国新型建材行业发展现状调 研与市场前景预测报告 报告编号:1683270 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了解该行业整体发展态势及经济运行状况,旨在为企业 ...

  • 中国数据中心行业分析报告目录
  • 中国市场调研在线 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了解该行业整体发展态势及经济运行状况,旨在为企业或投资者提供方向性的思路和参考. 一份有价值的行业研究报告,可以完成对行业系统 ...

  • 2017-2021年中国耐火材料行业现状及发展趋势分析
  • ▄ 前言 行业研究是开展一切咨询业务的基石,通过对特定行业的长期跟踪监测,分析行业需求.供给.经营特性.获取能力.产业链和价值链等多方面的内容,整合行业.市场.企业.用户等多层面数据和信息资源,为客户提供深度的行业市场研究报告,以专业的研究方法帮助客户深入的了解行业,发现投资价值和投资机会,规避经营 ...

  • 2017年分布式能源发展现状及市场前景分析 (目录)
  • 2016-2022年中国分布式能源市场深度调查 研究与发展前景分析报告 报告编号:1955767 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了解该行业整体发展态势及经济运行状况,旨在为企 ...

  • 中国印染行业投资分析及前景预测报告2016-2020年
  • 中国印染行业投资分析及前景预测 报告2016-2020年 编制单位:北京智博睿投资咨询有限公司 报告目录 第一章 印染相关介绍 1.1 印染的定义及历史 1.1.1 印染定义 1.1.2 印染加工分类 1.1.3 中国印染发展历史 1.1.4 中国印染工艺技术发展沿革 1.2 印染的基本工序 1.2 ...

  • 中国的供给侧改革──进程与展望
  • 中国的供给侧改革──进程与展望 经济学人智库报告 www.eiu.com The Economist Intelligence Unit(EIU ,经济学人智库)是作为the Economist newspaper姊妹公司的The Economist Group的研究和分析业务部门.1946年以来经 ...