The specialization trend in computer hardware: techincal perspective

Abstract

版权归属于作者 随着技术节点逐步缩小,登纳德 缩放比例定律将不再适用,这已 经成为计算机架构设计师面临 的一个新的挑战。过去,根据登 纳德缩放比例定律,芯片的运行速 度上升,功率就会下降,面积也会 缩小。并且,根据摩尔定律,这三 者的同时上升不会带来芯片成本的 明显增加。由于基于 CMOS 的技术 的出现,摩尔定律也将寿终正寝。 而且,随着工艺的特征尺寸过渡到 20nm以下,至少其中两项 速度 和功率 会逐渐停止改善。事实上, 一些专家们认为,在单个晶体管的 成本方面,28nm 工艺是最便宜的。 缩放的放缓将对电脑运算所 涉各领域产生深远的影响。随 着更多功能、更严功率限制在 未来将成为常态,硬件系统的 设计方式也将首先受到影响。 这一点在移动平台领域最为明显, 尤其智能手机,不断追求更多功 能、更长电池使用时间。要满 足更为严格的性能功耗比要求, 仅靠过渡到下一代通用计算机是远 远不够的。 专用化是提高能源效率的一个 替代方案,但只有在有显著需求的情 况下,该方案才能产生经济价值。 要想找到平衡点,可以设计适用于特 定应用领域、具有一定程度可编程性 并具有足够应用空间的部件。本论文 所介绍的研究做到了这一点。 作者介绍了一个可编程卷积引 擎,它采用一个 1D 或 2D 模板,并 与一个 1D 或 2D 数组(2D 图像便 是一个典型例子)相卷积。模板比 图像小很多。模板大小可低至 3x3 像素,而图像则可高达数亿像素。 模板的大小是可编程的,这正是它 的功能所在。该功能是可以广泛适 用的,特别是在图像处理、计算机 视觉以及虚拟现实这一新兴领域。 此类功能已在各种移动平台上快速 运用,证明移动平台需要高能效地 使用此类功能,因为调整专门的卷 积处理器并不难。这一观点是促使 作者研究可编程卷积引擎的动机。 就可编程卷积引擎本身而言, 还需做出重要的设计选择,才能使 绝大多数决策实现专用化。为了指 导这些设计选择,作者提出了一个 重要观点,“专用单元通过将数据 存储结构与数据流和算法的数据局 部性要求相调谐,实现了大部分的 效率增益。”这一关键发现极大地 有利于提高性能功耗比。卷积涉及 大量的数据移动,例如,大图像必 须从存储器访问。这些访问遵循明 确的模式,只要确定卷积种类以及 模板大小,就可以预先计算出这些 模式。周全的设计将允许执行这些 技术视角 计算机硬件的专用化趋势 作者:Trevor Mudge 如要查看随附论文 请访问 doi.acm.org/10.1145/2735841 rh 研究亮点

DOI: 10.1145/2735839

Cite this paper

@article{Mudge2015TheST, title={The specialization trend in computer hardware: techincal perspective}, author={Trevor N. Mudge}, journal={Commun. ACM}, year={2015}, volume={58}, pages={84} }