超级计算机
历史
“超级计算机”一词并无明确定义,其含义随计算机业界的发展而发生变化。早期的控制数据公司机器可达十倍速于竞争对手,但仍然是比较原始的标量处理器。到了1970年代,大部分超级计算机就已经是向量处理器了,很多是新进者自行开发的廉价处理器来攻占市场。1980年代初期,业界开始转向大规模并行运算系统,这时的超级计算机由成千上万的普通处理器所组成。1980年代中叶,将适量的矢量处理器(一般由8个到16个不等) 联合起来 进行并行计算成为通用的方法。1990年代以后到21世纪初,超级计算机则主要由基于精简指令集的处理器(譬如PowerPC、PA-RISC或DEC Alpha)互联进行并行计算而实行。
用途
超级计算机常用于需要大量运算的工作,譬如天气预测、气候研究 、运算化学、分子模型、天体物理模拟 、汽车设计模拟 、密码分析等。

商用PC零件组装的超级电脑CLIC,于德国开姆尼茨工业大学

1963年使用打孔机的第一代 Atlas超级电脑
设计
超级计算机的创新设计在于把复杂的工作细分为可以同时处理的工作并分配于不同的处理器。他们在进行特定的运算方面表现突出,但在处理一般工作时却差强人意。他们的数据结构是经过精心设计来确保数据及指令及时送达——传递速度的细微差别可以导致运算能力的巨大差别。其输入/输出系统也有特殊设计来提供高带宽,但是这里的数据传输延迟却并不重要——超级计算机并非数据交换机。
根据阿姆达尔定律,超级计算机的设计都集中在减少软件上的序列化、用硬体在瓶颈上加速。
技术挑战及其解决方案
超级电脑通常产生大量的高热,冷却超级电脑 是一个很大的问题。
因为数据传送的速度不能比光快,几米的距离导致了几十纳秒的延迟,而克雷著名的环型设计保持了最短距离。
超级电脑在短时间内消耗及生产大量的数据,需要投入很多资源确保资讯妥善传送及访问。
因超级计算机而开发的技术:
矢量处理器
水冷技术
非均匀访存模型
处理器技术
矢量处理因超级计算机而创建并用于高性能运算。矢量处理技术后来被用于普通电脑内的信号处理架构及单指令流多数据流,例如:电视游乐器及通用图形处理器等。
操作系统
一般的超级计算机都使用Unix或类Unix操作系统,但在讲求绝对高性能的操作环境时,超级电脑开发人员会动用特别的轻量级核心(Light Weight Kernel-LWK),减少中断请求、进程间通信等开销以提高性能。
轻量级核心包括Cray XT3的Catamount ,Cray XT4的CNL (Compute Node Linux) , 以及IBM蓝色基因的CNK(Compute Node Kernel)。
编程环境
消息传递接口及较旧的并行虚拟机(PVM)常用于非共享内存系统(Distributed Memory System),而OpenMP常用于共享内存并发系统。
传统上Fortran的编译器可以产生比C或C++更高性能目标代码,所以Fortran仍然被使用作科学编程。
优化编译器
超级电脑需要编译器优化技术以产生优佳的目标代码,现今的优化编译器都对向量化(Vectorization)、程序循环、内存层次结构及数据局部性进行优化。
此外,优化编译器都以高层次的中间表示(Intermediate Representation)优化程序 - 包括Open64编译器的WHIRL、 IBM XL编译器的Wcode。
数学函数库
超级电脑主要运行科算等拥有大量向量及矩阵浮点计算的程序,因此优化常用的数学函数会提高运算性能。BLAS函数库使向量及矩阵浮点计算性能大大提高, 而优佳化数学函数库则提高三角函数及平方根等数算。
平行文件系统
平行文件系统属于分布式文件系统的一类,支持多客户端节点、多文件系统服务器,以及支持平行I/O(如MPI-IO、HDF5);现今流行的平行文件系统包括Lustre和PVFS。
网络技术
超级电脑节点之间的通信一般都需要使用高性能的网络接口,现今大多TOP500的超级电脑使用以太网(44.8%)及InfiniBand(41.8%)。
传统上InfiniBand比以太网有更高的带宽,同时因操作系统调用省略(Operating System Bypass)而提供更低的延迟时间(latency);然而2011年思科系统开发VFIO技术于超级电脑和簇应用,使一般的以太网接口也能提供低延迟时间,从而提升以太网在超级电脑的应用层面。
通用超级计算机的类型
大致上可以分为三种:
矢量处理机器能为大量数据同时进行同样的运算。
丛集式处理器特别创建连接处理器及记忆体的通信网络,非均匀访存模型就是最常见的。最快的超级计算机就是使用这个科技。
商品电脑丛集使用高带宽低延误的网络来连接大量普通商品电脑,建设成一个电脑簇。
根据摩尔定律及经济规模,一个现代的桌面电脑比15年前的超级计算机有更高性能,皆因某些超级计算机的设计已经放在桌面电脑内。再者,简单芯片的开发及生产成本比特意设计给超级计算机的更便宜。
超级计算机所处理的问题都适合并行化,当中减少处理单元之间的资料传送量。因此,传统的超级计算机可以被电脑丛集所代替。
速度单位
超级计算机速度以每秒浮点运算次数"FLOPS"(floating-point operations per second)来作量度单位,常见的表示电脑中的峰值或速度用的单位英汉对照如下:
一个MFLOPS(megaFLOPS)等于每秒100万(=10 )次的浮点运算
一个GFLOPS(gigaFLOPS)等于每秒10亿(=10 )次的浮点运算
一个TFLOPS(teraFLOPS)等于每秒1万亿(=10 )次的浮点运算
一个PFLOPS(petaFLOPS)等于每秒1千万亿(=10 )次的浮点运算
一个EFLOPS(exaFLOPS)等于每秒100亿亿(=10 )次的浮点运算
此外,由于浮点积和熔加运算或乘积累加是两次的浮点运算(每条FMA指令包括加/减及乘),因此当处理器支持FMA指令时,峰值是两倍每秒所能运行FMA指令的数目。
目前最快的超级计算机
截止到2016年8月1号,世界上运算速度最快的超级计算机是由中国国家并行计算机工程中心研制的神威太湖之光。
过往的超级计算机

IBM蓝色基因
2009年10月,中国研制的第一台千万亿次超级计算机在湖南长沙亮相,全系统峰值性能为每秒1.206PFlops。这台名为天河一号的计算机位居同日公布的中国超级计算机前100强之首,也是当时世界上最快的超级电脑。天河一号的研制成功使中国成为继美国之后世界上第二个能够研制千万亿次超级计算机的国家。
2008年11月,IBM的Roadrunner成为当时最快的超级电脑,运算能力为1.105PFlops。
2008年11月16日,美国Cray超级电脑公司推出Jaguar系列,运算能力为1.059PFlops,采用45376颗四核心的Opteron处理器,362TB的内存,传输总带宽284GB/Sec,硬盘容量超过10PB,内部的数据总线带宽532TB/Sec。这台电脑将放置在美国的国家高速电脑中心,并开放给各界有需要的团体申请使用。
2007年11月,IBM的Blue Gene/L,运算能力为478.2 TFlops,安装了32768个处理器。它是PowerPC架构的修改版本,正式运作版本被推出到很多地点,包括罗兰士利物摩亚国家实验室(Lawrence Livermore National Laboratory)。
在Blue Gene/L之前,最快的超级计算机是日本电气株式会社在横滨地球科学学院的地球模拟器。它由640个特别设计的8阶矢量处理器根据NEC SX-6架构所组成的丛集,使用UNIX的修改版本。
在地球模拟器之前,最快的超级计算机是美国加州罗兰士利物摩亚国家实验室的ASCI White,它的冠军位置维持了2.5年。
类超级运算

日本富士通公司和理化学研究所开发的超级计算机京
某些分布式运算把丛集超级运算推至极限。例如SETI@home计划现在平均有667.716 TeraFLOPS运算能力。 .
2009年4月,Folding@home声称拥有超过8PFLOPS运算能力。
GIMPS运算能力也高达18TFLOPS。
Google的搜寻引擎系统Google server farm总处理能力界乎于126及316TFLOPS之间。Tristan Louis估计这个系统等于32000至79000台双2 GHzXeon电脑 。由于散热问题,Google的搜寻引擎系统应该属于网格运算。
超级计算机时间线
专用超级计算机
专用超级计算机都是针对单一问题而开发的电脑。这些电脑都使用专门编程的FPGA芯片及超大型密集芯片,纵然牺牲普遍性也要提高成本性能比率。它们被用于天文物理学及密码破解之上。
例子:
深蓝,专门用于分析国际象棋
GRAPE,天文物理
Deep Crack,DES解码器
科幻中的超级计算机
Matrix-“母体”是电影《黑客帝国》中,由机器所创造出的一个模拟环境,用以控制人类,并从人类身上吸取能源。
Skynet-“天网”是电影《终结者》中美国军方所开发具有人工智能的超级电脑,但后来它具有自我意识而以全人类为敌。
MAGI-“麦棋”是动漫《新世纪福音战士》中,设立于NERV总部由三台主机组成的超级电脑。MAGI是古代三贤人的称呼,他们是耶稣诞生的时候赠送耶稣礼物的东方三贤人。与使徒的对战中,用以判断使徒的降落点与分析使徒弱点,提供攻击方针以及成功概率做参考数值。特别的是将三个不同的人格加入了三个主机当中,分别是科学家、母亲、女性,在理性的计算之外也拟人的加入性格作为判断的依据。当判断有冲突时,三贤人系统会以投票机制做最后定夺。
HAL 9000-2001年太空漫游中主角鲍曼所乘搭的太空船发现号的主机,被安装了可以在必要时杀死乘员的功能。
TRANSLTR是丹·布朗(Dan Brown)的小说-《数字城堡》中美国国家安全局所暗中开发的超级电脑,主要用来监听互联网数据包,破解一切可能对国家安全造成威胁的加密消息,包括加密的电子邮件,但是它的存在不被政府所承认。
Veda-“吠陀”是日本动漫《机动战士高达 00》中由雪儿·亚克斯迪卡(Chall Acustica)所集成的量子型计算机,由天人组织(Celestial Being)所使用,连接上地球所有网络,瞬间获得任何资讯,计算出预算方案。能与所谓“变革者”(Innovator)及原始变革者以脑量子波为媒介进行同步连接。
X.A.N.A,来自动漫Code Lyoko一台有人工智能的超级计算机,原用于计算,后用与摧毁军事机密,有倒转时空的能力。他的发明者后来发现此功能后不断使用,导致X.A.N.A不断自我升级。最后X.A.N.A通过计算得出结论:主宰地球。于是不断发动X.A.N.A的环境平台‘Lyoko’里的圆塔(开启后可用于计算使用并能实现虚拟事物现实化)通过电缆对人类进行破坏。后来它能够实体化,把‘lyoko’删除了,但是被潜伏在世界上其他超级计算机里的发明者发回了‘Lyoko’原资料,‘Lyoko’才得以重建。
树状图设计者,来自日本动漫《魔法禁书目录》和《科学超电磁炮》中以分析气象资料为借口,搭载于织女星一号卫星上的超级计算机;每月会运算一次地球上所有空气粒子运动,可一次运算一个月的天气;其他日子就用来对学园都市的许多研究进行科研运算。
注释
^ 英语原文为HVAC,即“heating, ventilation, and air conditioning”的首字母缩略字,中文直译为“加热、通风、空调”,是建筑技术领域的一个子领域,这里依照实际情形,略作“通风空调”,因为超级计算机运作时对加热的要求显然不高。请参见英文版维基百科条目en:HVAC。
(中文) 上海超级计算中心
(英文) 劳伦斯利福摩尔国家实验室 (LLNL)高性能计算主页——位于美国的劳伦斯利福摩尔国家实验室
(英文) HPCx——英国超级计算机服务,由EPCC及Daresbury实验室营运
参见
贝奥武夫机群
分布式计算
快闪党电脑
网格运算
运算历史
并行计算
主机
量子电脑
微型电脑
小型电脑
大型机
克雷研究公司
富士通
星盈科技
Groupe Bull(法国公司,曾宣称制造欧洲最高性能的超级计算机)
IBM
NEC
超级计算机系统
SGI
太阳微系统(提供Sun Grid Engine、Lustre文件系统等开放源代码软件)
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

相关资料

- 有价值
- 一般般
- 没价值








24小时热门
推荐阅读


关于我们

APP下载


{{item.time}} {{item.replyListShow ? '收起' : '展开'}}评论 {{curReplyId == item.id ? '取消回复' : '回复'}}