当前位置: 首页 > 期刊 > 《知识窗》 > 2017年第2期 > 正文
编号:12977082
超级计算机是个啥?
http://www.100md.com 2017年2月1日 《知识窗》2017年第2期
超级计算机是个啥?

     2016年11月,“国际超级计算机TOP500”在德国法兰克福公布了最新的世界超级计算机排名,我国自主研制的“神威·太湖之光”超级计算机,每秒浮点运算次数达到 93 千万亿次,成为全球最快的超级计算机。

    超级计算机是什么东西?

    顾名思义,与一般的小型计算机相比,超级计算机就是具有超量级计算能力的机器。我们的个人计算机功能貌似强大,但要是碰上处理超大数据量以及特定的计算用途,计算能力就远远跟不上了。怎样才能解决这个窘境呢?

    一个很符合逻辑的办法就是,一台机子不行,那就把千千万万台机子连起来,“机多力量大”嘛。所以,简而言之,超级计算机系统是一个把很多计算机的计算能力有机地叠加在一起,以便满足特定的计算应用的集群。

    那么,超级计算机的具体作用在哪儿呢?

    别急,下面的三个小故事会带你进入未知的超级计算机世界。

    1

    艾伦·麦席森·图灵(1912年-1954年),英国数学家、逻辑学家,被称为“计算机之父”。电影《模仿游戏》讲的就是他的故事,电影故事的主线是讲如何破解德军使用的复杂密码加密机器恩尼格码。恩尼格码每天深夜自动切换密码,有1016 种不同的变化,用人工计算的方法根本来不及在下一次切换前破解,这使得盟军无法提前得知德军轰炸和潜艇猎杀的计划,损失惨重。

    为了破解德国密码系统恩尼格码,并尽快结束战争,图灵奉命于危难之间,在分析了大量德国电文后,发现了许多电报有相当固定的格式。

    以此为突破点,图灵想到了用“候选单词”这一方法来破译恩尼格电文,并提出了唯有机器才能击败机器的理论。他率领军情六处的科学家们秘密研发破译密码的机器,并于两年后成功破解了德军密码。

    图灵发明的计算机,扭转了大西洋战场的局势,使二战至少提前两年结束。

    之所以提到这个故事,是因为这是最早利用计算机破译密码的例子。如果用今天最快的超级计算机来暴力破解恩尼格码,需要多少时间呢?以“神威·太湖之光”的运算速度粗略地算,大概也就是 0.11 秒的事情!

    2

    2016年3月,人机大战,世界围棋冠军李世石居然输给了“阿尔法狗”,而且输得很难看。

    开赛前,无论是科技界还是围棋界,根本对“阿尔法狗”战胜李世石不看好,“棋圣”聂卫平也断言“阿尔法狗”根本不是李世石的对手。

    这一战,打了很多人的脸,但也让“人工智能”这个潮词隔三差五地出现在新闻标题中。然而,你不知道的是,人工智能这朵迷人又抢眼的红花,没有了超级计算机这片绿叶的衬托,也是枉然。

    你以为跟李世石对战的就只是那台电视直播里看到的小电脑吗?错了!是后面看不到的庞然大物。

    这台计算机的单机版装有 48 个 CPU 和 8 个 GPU,算得上是小型的超级计算机,浮点运算能力可以达到每秒11万亿次。但为了达到更好的运算性能,“阿尔法狗”在训练和对战时还接入了1920个由CPU组成的网络之中进行云计算,这远程的计算能力也能传输给“阿尔法狗”,使其性能比单机版提高40倍,这才达到了挑战人类高手的门槛。

    你也许会经常听到隔壁的电脑男谈论CPU 的运算速度或频率,这个战斗数值放在超级计算机身上叫做每秒浮点运算次数,也就是对浮点数据进行运算的速度能力。

    以搭载 i7-5500U 第五代酷睿处理器的联想电脑为例,其主频是2.4G赫兹,根据系统分析评测工具Whetstone benchmarks 得出其浮点运算速度大致为每秒142亿次运算。

    粗略地做一下比较,一台“神威·太湖之光”的运算能力相当于 64 万台普通的联想电脑,它开机1分钟的工作量等于普通联想电脑444 天的工作量,效率之高,不可谓不强悍。

    人机大战故事中的人工智能由软件和硬件组成,算法是软件,而超级计算机则是不可替代的硬件。在与李世石这样的顶尖高手进行争分夺秒的对弈过程中,软件即使写得再漂亮,如果超算速度跟不上的话,李世石下好了子,你的机器恐怕还没算完呢!

    所以说,运算速度就是超级计算机的命根子。

    3

    “天宫一号”是中国第一个目标飞行器和空间实验室,也是空间交会对接试验中的被动目标。它于2011年9月29日升空,目前已在太空逗留了 5 年有余,预计将于 2017 年返回地球。

    问题是,人类飞行器在返回地球过程中会发生“黑障”现象,与大气剧烈摩擦使其上升至一千多摄氏度,并且通讯信号完全消失,这是一个十分危险的阶段。所以,要提前预知其在降落过程中详细的飞行数据和安全系数,以做到万无一失。

    但像这种耗资巨大、需动用各方面力量才能完成的高端空间飞行,研发人员在地面上根本做不到真实实验,而传统的风洞试验结果也并非 100% 绝对可靠。

    这时候,超级计算机便派上用场了。

    国家计算流体力学实验室很机智地借用了国家超级计算无锡中心的“神威·太湖之光”超级计算机,对“天宫一号”返回过程进行了电脑试验,以进一步加强对数据可靠性的判断。

    研发人员把“天宫一号”飞行器两舱简化外形(长度 10 余米、横截面直径近 3.5 米)、陨落飞行(高度为 65 千米 和 62 千米,速度为 13 马赫)、绕流状态情况进行了大规模并行模拟。实验使用了16384个处理器,在20天内便完成了常规需要12个月的计算任务,效率足足提高了18倍,并且计算结果与另一个风洞实验结果较为吻合,为“天宫一号”飞行试验提供了重要的数据支持。

    一直以来,包括航天领域在内的科学研究是复杂运算的重灾区。传统计算机由于运算效能低下,使得科学家不得不遗弃很多科学研究。而如今超级计算机的加入,则像是摘掉了科学家头上的紧箍咒,使得科学的世界一下子神清气爽。

    三个故事讲完了,相信你对超级计算机也有了更多的了解。 (魏莹)