CPU + GPU将开启HPC新时代

2011-11-09 07:16刘文卓
中国教育网络 2011年9期
关键词:平民化晶体管计算能力

CPU + GPU将开启HPC新时代

越来越多的研究人员和商业组织开始利用GPU来完成大规模的计算,并开创了一个新的研究领域:基于GPU的通用并行计算。

发展到现在,HPC已经走上了平民化的道路。

一般HPC都是做超大规模的繁重计算,像大型工程、桥梁飞机制造以及气象预报等方面的计算及应用,对浮点运算的要求比较高。AMD皓龙处理器做浮点运算一直相当出色,64位、直连架构等特性都对H P C最终走向平民化起到了推动作用,像现在TOP500中Cray的超级计算系统采用的就是A M D的皓龙处理器。

目前,功耗和性能是困扰HPC的两大难题。AMD 8/12核的皓龙处理器可以为HPC降低能耗,它可以根据不同的应用关掉无用的核心,当机房不够大供电能力不够强的时候可以对芯片进行功耗上限设置,或者通过降频等技术来完成能耗的节省。

按照摩尔定律,CPU一般的更新换代时间是18个月,也就是说它能够在18个月后性能就可以翻一番。而GPU的更新速度是CPU的1.5倍,也就是说通常1 2个月的时间G P U的性能就翻了一番。大概五年前,CPU和GPU的晶体管数量是差不多的,而现在GPU的顶端产品大概可以拥有超过20亿个晶体管,远超过了CPU集成的晶体管数量。CPU里主要是做分支运算、预测等工作的,而在大规模并行尤其是数据并行计算领域,目前高端的GPU已经拥有了无与伦比的处理能力。

而且CPU里面大约有超过40%是运算单元,只有5%是逻辑单元,发展到现在,最快的CPU和GPU产品比较,在单精度32位计算上GPU的运算速度是CPU的50倍,64位运算上是10倍,快很多。此外在能耗上,一台超级计算机一天就要消耗2万元的电,如果用GPU整个规模就可以降低。同样的计算能力,GPU可以把能耗降到1/5或不到一半的规模。

传统的GPU由于缺少通用的高级编程语言的支持,很难做编程,所以一般很少人用。但随着通用计算设备上的统一、开放标准OpenCL的推出和不断发展完善,用户利用GPU做通用计算从实现的角度来说变得越来越容易了。而且如前文所述GPU的每瓦性能又确实很高,所以,越来越多的研究人员和商业组织开始利用GPU来完成大规模的计算,并开创了一个新的研究领域:基于GPU的通用并行计算。

目前已成功应用于气象模拟、基因工程、石油勘探、运动规划、代数运算、优化计算、偏微分方程、数值求解、流体模拟、数据库应用、频谱分析等领域,也包括图形图像处理、金融统计预测、智能信息处理系统、数据挖掘工具等商业化应用。同时,也产生了一些针对G P U开发的通用计算工具包,能够基于GPU平台对FFT、BLAS、排序及线性方程组求解等科学计算进行优化实现,与单纯依靠CPU实现的算法相比,平均性能提高了近20倍。

AMD于2006年成功整合了ATI,所以利用GPU做通用计算的技术有着得天独厚的优势。目前高端GPU虽然有很强的计算能力,但很多时候由于受PCIE总线带宽的限制,CPU和GPU之间大规模的数据交互就成了很多高性能计算任务的瓶颈。

为此,AMD推出融合了CPU和具有通用计算能力GPU的产品—Fusion APU。目前开发的产品主要用于笔记本、台式机和平板电脑等,相信未来也可以将类似技术迁移到服务器平台。全新的APU架构完美解决了原有平台架构中CPU和GPU之间大规模的数据交互耗时问题,为用户灵活利用CPU和GPU编程克服了一个最主要的障碍,并进一步显著提升了每瓦特电量的计算能力,由此可以看出,GPU+CPU的融合是未来通用计算的必然趋势。

刘文卓 AMD中国区技术总监

猜你喜欢
平民化晶体管计算能力
浅谈如何提高小学生的计算能力
科学家首次实现亚1纳米栅极长度晶体管
小学生计算能力的提高策略
2.6万亿个晶体管
小学生计算能力的培养
功率晶体管击穿特性及测试分析
苏轼的平民化人格与其晚年书法的朴拙美
浅谈小学生计算能力的培养
解读受众视域下网络剧的发展路径
薄膜晶体管(TFT)介绍薄膜晶体管物理与技术