当今世界,高性能计算已成为理论和试验之外的第三种科学研究手段,是推动科技创新和经济社会发展的战略高技术。各大国纷纷投入巨资研制开发超级计算机系统,以提升综合国力和科技竞争力。
在2009年6月公布的世界超级计算机500强中,美国占据291席,欧洲占据145席,亚洲仅占十几席。与发达国家相比,我国不仅在计算能力上相差一个量级,装机数量也相去甚远。那么,要研制成功“天河一号”这样的巨型计算机,研究人员面临的最重要的技术难点主要有哪些?
“天河一号”工程重要参与者、国防科学技术大学计算机学院的李思昆教授介绍,任何一台巨型计算机的研制都必须要解决以下几大难题。
首先,在体系结构方面。一台计算机从百万亿次到千万亿次的跃升并不只是一个简单的数字上的变化,而需要在其体系结构上进行大量的创新和调整。“如果原来是10个人来完成某项工作,现在就相当于要有100个甚至1000个人来完成一个工作。”需要设计出一套让这数千个部件可以和谐互联的体系系统。
第二点,是如何来应对错误。李教授称,“天河一号”有1万余个部件,从科学角度来讲,故障是不可避免的,“这就需要设计出一套机制来保证某个部件的错误不至于影响到整个系统的运作,此外还可以尽快找到并排除错误。”
第三点,就是要解决能耗问题。巨型计算机的能耗极大,即使是效能已经很高的“天河一号”,每小时的耗电量也达到1280千瓦/时。“一美国科学家曾说过,‘不解决能耗问题,那么巨型计算机就只能和核电站建在一起了。’”而美国就打算把未来的巨型计算机建在海边,因为核电站需要用海水来为核反应堆降温。