互联网 > 正文
人工智能网热度:

云服务器FPGA架构及其电源方案初探

随着时间的推移,FPGA 可重配置及可再程序设计的固有能力或许是其在快速发展领域中的最大优势。FPGA 可利用动态重配置,在不到一秒的时间内针对不同设计快速变化,从而可针对新的工作负载进行硬件优化。 因此,FPGA 能提供复杂多变超大规模应用所需的灵活性、应用广度和功能速度,这是 GPU 和定制 ASIC 无法实现的。

随着高性能计算和人工智能技术的快速发展以及大数据的爆发式增长,人工智能的算法设计理念发生了转变。人工建立算法的做法被计算机通过从大数据中自动学习的方法所取代,使得计算机视觉、语音识别、自然语言处理等关键领域都出现了重大突破。深度学习是这些领域中最常使用的技术,也被业界大为关注。然而,深度学习模型需要极为大量的数据和计算能力,只有更好的硬件加速条件,才能满足现有数据和模型规模继续扩大的需求。现有的解决方案使用图形处理单元(GPU),尽管 GPU 对深度学习算法而言在性能方面是一种更好的选择,但其功耗太高使得应用也受到很大限制。

今天的 CPU 一直无法满足当前计算密集型应用(如机器学习、数据分析和视频处理等)的需求。加上网络与存储方面日益明显的瓶颈,云服务供货商转而采用加速器来提高其云数据中心的整体吞吐量和效率。

亚马逊、微软和百度等大型云端服务供货商已宣布在其超大规模数据中心部署 FPGA 技术,推动其服务业务在竞争极为激烈的市场不断发展。FPGA 能与高度灵敏的云计算环境形成全面互补,因为它们不仅可程序设计性,而且还能针对任何新应用或新算法进行硬件优化。

图一 服务器部署 FPGA 的架构

随着时间的推移,FPGA 可重配置及可再程序设计的固有能力或许是其在快速发展领域中的最大优势。FPGA 可利用动态重配置,在不到一秒的时间内针对不同设计快速变化,从而可针对新的工作负载进行硬件优化。 因此,FPGA 能提供复杂多变超大规模应用所需的灵活性、应用广度和功能速度,这是 GPU 和定制 ASIC 无法实现的。其实FPGA不仅在计算的加速具有良好效果,其也可以应用于数据中心存储和网络的加速,FPGA可为云服务计算、存储、网络带来综合的提升。

FPGA作为一个加速卡,已经有几十年的历史。但是在数据中心应用有所不同,FPGA首先要提供云服务,能够满足大规模部署和运维的需求,满足云服务的特性,包括远程监控管理、在线动静态逻辑的重构,也需要支持各种虚拟机访问以及支持各种驱动兼容性,整个加速卡也需要有更高的RAS特性,这些在服务器里面,可能是比较通用的性质,但是先前的FPGA加速卡,并没有这类应用场景需求,也不具备这些特性,存在很大缺失。FPGA更重要的是一种FaaS(FPGA as a Service)服务,一种方案能够将软件、算法和硬件板卡集成,以软硬一体化的形式。FaaS围绕深度学习预测、视音频处理、基因测序、金融分析、IoT等热点行业提供了非常完备的解决方案。

图二 FaaS(FPGA as a Service)

云端运算数字多台并联DC-DC电源模块,可应用之输入电压范围从8.0~15V,输出电压则为0.6~1.8V,IC操作频率为500KHz,搭载尺寸13.5x13.7mm,双组电感,感值为0.2uH电感,另为了满足数字化的需求及提供监控方法,我们采用I2C通讯协议作为客户取得模块内部信息,如下表。

表3 设计目标规格

1. 电路架构

根据下图三为整合具备数字及并联能力的控制IC与高积体MOSFET及双线圈厄流器(Power Choke),透电路设计,计算出电感之感量需求,以及减少铜线线圈及磁性粉材量,进而开发出市面上大功率数字DC-DC 模块。图四为四组并联线路,依据单组模块进行并联使用,可在现有输出60A以下再增加输出电流至200A,采用PM-Bus Interface 控制方法,并且利用I2C传输接口控制各模块输出电压、侦测输出电流、温度以及控制每个模块电流均流。

图三、云端运算数字DC-DC电源模块(Block diagram)

图四 云端运算数字DC-DC电源模块并联模式(Block diagram)

2. 电性特性比较

根据计算结果与实测分析,我司生产制作大功率数字DC-DC 产品,其效率优于市面上产品,因为我们采用堆栈制程,将电感堆栈至模块上方,利用铜柱搭接,增加电流路径,降低损耗,并且选用高积体 MOSFET 减少开关切换的损耗,依据以上原因进而提高满载整体效率。

图五、模块效率量测

3. 模块并联均流

MSN12AD60-RUD 该模块具备自动均流的功能,并且此功能再多颗模块并联时,也能够及时运算并且调整各组模块的电流一致性,防止在并联时模块发生功率不一致。图量测模块电感电流

图六、模块输出电流均流

图七、动态模块输出电流均流

4. PMBus通讯协议测试

因我司研发的大功率数字模块,采用PMbus通讯协议并且利用I2C传输,可以藉由PC搭配GUI与DONGLE(图19) 进而对模块进行数据读取与控制输出电压,因此这边针对该功能进行测试。

图八、PMbus 系统架构

图九、GUI实测状态

Cyntec利用GUI该套软件,可以直接监控模块目前状况以及,错误讯息,上图可以发现监测部分输入电压、输出电压以及电流与温度,右侧可以显示目前模块的状态,是否有错误讯息。

图十、Labview 测试状态

Cyntec利用Labview 撰写程序仿真MCU在工作的时候,送入PMbus 讯号,也是可以监控模块目前状态以及系统参数。

欢迎关注微信公众号:dcwlcm666;合作及投稿请联系:1519329887@qq.com

赞助商