下一次FPGA平台活动的见解

作者:
绿色编织
战略规划与业务发展副总裁

发布于:2020年2月4日

1月22日参加Next FPGA平台非常激动nd 在圣何塞的玻璃屋。我发现让Achronix与Xilinx和英特尔一起参加小组讨论特别令人兴奋。Next Platform的联合编辑Nicole Hemsoth和Timothy Prickett Morgan在采访FPGA生态系统的专家时做得很好,提出了有见地的问题。Next Platform活动的最佳部分是其形式,在这种形式下,他们将营销宣传降至最低,没有演示,只有讨论。我将总结这次活动的一些见解和观察结果。
 

数据加速时代

活动前,蒂姆写了一篇题为“可编程逻辑的三个时代, 在一对一的采访中,我进一步阐述了我们对 FPGA 3.0——数据加速时代我在FPGA行业工作了15年多,对即将到来的FPGA第三时代感到非常兴奋。有三个关键原因让我觉得第三个时代最令人兴奋。

  • 显著提高TAM/SAM增量 受快速变化的数据加速工作负载以及云中和网络边缘数据处理的指数级增长的推动,FPGA的估计价格为100亿美元以上。在第三个时代,数据正在推动新经济的发展。正如他们所说,数据是新的石油,FAANG公司(脸书、亚马逊、苹果、网飞和Alphabet(又名谷歌))的估值不仅受其商业模式的驱动,还受数据货币化的驱动。要理解所有这些数据,需要付出很多努力。这就是人工智能和数据分析的相关性所在,反过来又推动了计算需求的数量级增长。
  • FPGA不仅仅是ASIC原型 系统中的车辆或侧车组件,但它们本身作为计算引擎在行业中越来越被接受。
  • FPGA已经在数据中心大量部署我们正处于FPGA 3.0时代的早期阶段,与之前的其他时代一样,我预计这个时代将持续十年以上。

对Manoj Roge和Timothy Pricket Morgan的一对一采访

很高兴收到微软Doug Burger的验证,他们目前正在Azure基础设施内部署七位数的FPGA。数据中心传统上是围绕CPU构建的,但所有超大规模企业都承认,CPU无法跟上移动和处理数据方面日益严峻的挑战。所有讨论中的一个共同主题是数据中心需要异构加速器,而不是CPU是各种工作负载的通用解决方案。Doug强调,之前,FPGA在网络工作负载方面提供了极大的灵活性,这得到了电信部署的验证(我称之为FPGA 2.0时代或连接浪潮)。因此,将数据管理从CPU上转移是有意义的。其次,所有超大规模商都有自己的自定义要求,这使得基础设施管理人员难以使硬件适应不断变化的工作负载。FPGA是现场可编程硬件,是面向未来的数据中心基础设施的好方法。在FPGA 2.0时代,FPGA被用于面向未来的电信部署。

我花了很多年时间与网络客户合作。他们使用专有的数据包处理引擎设计了数据路径ASIC,并在线卡中使用FPGA进行接口适配和内存缓冲。多年来,MAC到因特拉肯智能网桥一直是网络中的头号用例。数据中心和AI ASIC架构师应该以同样的方式思考。Achronix的Speedster®7t FPGA通过支持112G SerDes、400G以太网、PCIe Gen5、GDDR6和DDR4/5等接口标准,减轻了许多复杂性。架构师应该像电信架构师一样,专注于ASIC中的秘密武器,以加快上市时间并大幅降低风险。

可编程逻辑的第四个时代可能是什么?

如果我看看我的水晶球并预测可编程逻辑的第四个时代,我相信FPGA将成为从云到边缘和物联网部署的无处不在的可编程构建块。基于这一愿景,Achronix建立了一种商业模式,授权FPGA IP(Speedcore™eFPGA)嵌入客户的ASIC或SoC中。借助Speedcore IP,客户可以设计定制FPGA以满足其应用需求。嵌入式FPGA提供了一个降低成本的连续体,其中固定功能在ASIC中得到强化,但灵活或面向未来的功能可以重新编程。

随着业界认识到对特定领域架构和本地化计算的需求,我看到FPGA IP变得无处不在。就像今天的内存IP和编译器一样。

人们普遍认为,数据需要在更接近其产生地的地方进行处理。通过这样做,您可以减少计算延迟,最大限度地减少网络流量和功耗,并提供更封装的安全性和缓解隐私问题。Speedcore eFPGA集成是大容量、低成本/功耗部署的最佳方法,Achronix在提供独立高性能FPGA和嵌入式FPGA IP方面具有独特优势。

与Achronix、Xilinx和Intel进行小组讨论

领域特定架构和语言的黄金时代

在我与Xilinx和英特尔的小组讨论中,我(和其他人)认为摩尔定律已经死了。使摩尔定律保持活力的是Dennard扩展和通过节点扩展实现的成本改进。Dennard缩放在十多年前就崩溃了,由于节点缩放而导致的成本降低在20nm节点停止了。因此,我们不能再仅仅依靠流程扩展,而需要用新的架构来推动创新。我们需要一个摩尔定律来推动建筑创新。英特尔向观众介绍了轩尼诗和帕特森的演讲,题为“计算机体系结构的新黄金时代”. Hennessy和Patterson认为,在摩尔定律之后,需要特定领域的架构,因为它们:

  • 为特定域提供更有效的并行性
  • 更有效地使用内存带宽
  • 消除不必要的准确性

FPGA是一个很好的空白硬件画布,可以提供这些好处。

除了前半天关于硬件创新的讨论外,下半天还有几场会议讨论用例和软件创新。人们普遍认为,为了更广泛地采用FPGA,行业和生态系统需要提供一个成熟的高级软件设计流程,抽象出所有低级硬件细节。好消息是,围绕特定领域的语言有很多活动,例如用于网络的P4和用于机器学习的TensorFlow。随着FPGA行业支持使用TensorFlow、算法进行Python级编程,设计人员可以编写Python脚本,而不必担心低级FPGA RTL编程。FPGA供应商和合作伙伴目前提供RTL优化的低级库或覆盖架构,可插入TensorFlow等高级框架。这些领域特定的语言、库和编译器最终将推动软件友好的硬件范式,类似于Cuda和CuDNN为Nvidia GPU所做的那样。

还有其他FPGA供应商的空间吗?

每个人都熟悉FPGA双头垄断,但英特尔收购Altera确实动摇了局面。英特尔非常关注CPU,其次他们押注于各种加速器选项,如Nervana和Habana for AI。在Achronix,我们看到了市场上的一个机会,客户想要一种新的高性能解决方案替代品。话虽如此,我们需要提供一些独特性。我们利用了创新者的困境,因为我们没有在旧FPGA产品上支持大量客户群的传统。相反,我们选择了一些工作负载,特别是计算和网络加速,并开发了一个独特优化的架构和功能,以满足应用程序对这些工作负载的关键要求。在开发新架构时,我们采取了一种全新的方法来解决传统FPGA架构中的瓶颈问题。凭借真人百家乐,Achronix重新发明了高性能FPGA解决方案,重点关注架构优化的三个关键支柱:

  • 高效计算 –我们针对数据加速和机器学习进行了原生优化。我们专注于原生结构优化,而不是采用异构多核解决方案,这使我们能够最大限度地提高设计重用率,避免数据流瓶颈,简化设计流程。
  • 均衡的内存层次结构和带宽 –我们设计了一种高性能架构,可以平衡片上和片外的计算和内存带宽。
  • 高效的数据传输 –通过嵌入式20Tbps片上网络(NoC)在芯片上移动数据,是第一个支持PCIe Gen5、GDDR6和4×400G以太网的FPGA。

Achronix在提供独立高性能FPGA和嵌入式eFPGA IP方面是独一无二的。简而言之,我们已经很好地开辟了自己的道路,并看到了客户和解决方案合作伙伴的巨大兴趣。我们衷心感谢他们对我们的信任,以及我们打破FPGA双头垄断的能力。