电子发烧友网>可编程逻辑> > 正文

FPGA与GPU计算存储加速对比:单位功耗性能考量因素

2021年08月20日 11:57 ? 次阅读

为了提升计算基础设施的性能,并紧跟数据分析与 AI 不断攀升的需求,众多企业将硬件加速视为主要的解决方案。在大多数情况下,先进的可编程硬件(主要是指 GPUFPGA)是加速的主要方式。通过使用这种先进的硬件,企业正在赢得计算优势;然而,对于编程难度,他们仍然存在合理的担忧。

poYBAGEfKIWAMSiTAANJzyTSf9k555.png

图 1:分析/AI 流水线组件

硬件制造商正在将加速方法应用于计算存储,这是专门设计用于包含内嵌计算元素的存储。这种方法已经被证明可以为分析和 AI 应用提供优异的性能(图 1)。使用或者不使用机器学习辅助的分析以及验证,都可以借助计算存储器件进行加速。这些器件提供了一个关键的优势,使得成本高昂的计算被卸载到存储器件上,而不必在服务器 CPU 上完成。与标准的存储/CPU 方法相比,通过计算存储获得的优势包括:

1. 借助应用专用编程定制可编程硬件,获得更高性能

2. 将计算任务从服务器卸载到存储器件,释放 CPU 资源

3. 数据与计算共址,降低数据传输需求

这种新颖的方法前景光明。不过,您应根据具体用例评估这种方法,考量性能、成本、功耗和易用性。性价比和单位功耗性能在选择加速硬件评估时,占据主要比率。在本文中,我们将研讨单位功耗性能(另一篇文章则专门研讨性价比)。

计算存储功耗比较

3种系统

在这个场景中,我们将比较以 CSV 数据读取用例为主的三种工具:英伟达 GPUDirect 存储 和RAPIDS存储,以及基于赛灵思技术的三星 SmartSSD 存储。CSV 读取在计算密集型流水线中起着重要的作用(参见图 1)。

在下文中,我们将性能定义成 CSV 的处理速率,或处理“带宽”。我们先快速回顾一下三种系统的运行方式。

英伟达 GPUDirect 存储

·端到端满足分析和 AI 需求

·将 GPU 用作计算单元,紧贴基于 NVMe 的存储器件布局 (GPUDirect)

·使用 CUDA 进行编程 (RAPIDS)

英伟达用其 CSV 数据读取技术衡量相对于标准 SSD 的性能提升。结果如图 1 所示。使用 1 到 8 个加速器时,对应的吞吐量是 4 到 23GB/s。

三星 SmartSSD 驱动器

·将赛灵思 FPGA 用作计算单元

·与存储逻辑内嵌驻留在同一个内部 PCIe 互联上

·通过编程在存储平台上开展运算

赛灵思数据分析解决方案合作伙伴 Bigstream 与三星合作,为 Apache Spark 设计加速器,包括用于 CSV 和 Parquet 处理的 IP。SmartSSD 的测试使用单机模式的 CSV 解析引擎,以便开展比较。结果如图 2 所示,使用 1 到 12 个加速器时,对应的吞吐量是 4 到 23GB/s,同时也给出英伟达的结果(使用 1 到 8 个加速器)。请注意,本讨论中的所有结果都按 x 轴上的加速器数量进行参数化。

这些结果令人振奋,但在选择您的解决方案时,请务必将功耗情况纳入考虑。

poYBAGEfKJiAMRnjAAGoUIW3J0c769.png

图 2:SmartSSD 驱动器的 CSV 解析性能结果

单位功耗性能比较

图 3 显示了将功耗考虑在内后的分析结果。它们代表单位功耗达到的性能水平,根据上述讨论中引用的相关材料,给出了以下假设:

·Tesla V100 GPU:最大功耗 200 瓦

·SmartSSD 驱动器 FPGA:最大功耗 30 瓦

poYBAGEfKKSAZzVDAAFnh5Dujr4099.png

图 3:CSV 解析的每瓦功耗带宽比较

在这个场景下,计算表明,在全部使用 8 个加速器的情况下,SmartSSD 的单位功耗性能比 GPUDirect Storage 高 25 倍。

FPGA 与 GPU 对比:有关单位功耗性能的最终思考

计算存储的优势在于能增强数据分析和 AI 应用的性能。然而,要让这种方法具备可实际部署的能力和实用性,就必须在评估时将功耗纳入考虑。

针对用于 CSV 数据解析的两种不同的计算存储方法,我们已经提出按功耗参数化的吞吐量性能曲线。结果显示,在使用相似数量的加速器进行比较时,SmartSSD 驱动器的单位功耗性能优于 GPUDirect存储方法。

GPUDirect 是英伟达通过 NVIDIA DGX-2 应用平台提供的研究系统。

三星 SmartSSD 驱动器是一种可部署的量产型 PCIe 可插拔平台,现在已经通过赛灵思及分销商供货。

如需了解更多信息,请查看:

· 有关 Bigstream 与 SmartSSD 计算存储器件结合使用,加速大数据和数据分析的电子书。

· Bigstream 硬件加速 Apache Spark解决方案。

· 有关使用三星 SmartSSD 驱动器给工作负载带来优势的 三星 SmartSSD 页面。

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

小鸟科技借助Xilinx Kintex? FPG...

赛灵思FPGA平台出色的性能和简洁易用的 Vivado?开发工具,助力小鸟科技将业界领先的专业音视频....
发表于 2021-08-20 14:22? 0次阅读
小鸟科技借助Xilinx Kintex? FPG...

借助自适应加速平台打造能适应快速环境变化的机器人

随着机器人能够适应不断改变的环境,它们的价值和潜在影响也在迅速攀升。
发表于 2021-08-20 14:19? 0次阅读
借助自适应加速平台打造能适应快速环境变化的机器人

Xilinx赋能深维科技GIF2WebP动图方案...

Xilinx? Alveo? U200加速卡助力深维科技 (DeePoly)ThunderImage....
发表于 2021-08-20 11:52? 102次阅读
Xilinx赋能深维科技GIF2WebP动图方案...

浅析HarmonyOS基于AI的通用文字识别技术

在资讯大爆炸的时代,我们经常面临文件、图片找不到的情况,HarmonyOS基于AI的通用文字识别技术....
发表于 2021-08-20 10:42? 104次阅读
浅析HarmonyOS基于AI的通用文字识别技术

华为城市智能体 助力打造智慧之城

田子坊整个商业区目前已经接入240+烟感,70+倾角仪,16+垃圾桶满溢等感知设备,并且通过布设8个....
发表于 2021-08-20 10:13? 212次阅读
华为城市智能体 助力打造智慧之城

FPGA、Verilog HDL与VHDL的优缺...

Verilog HDL 优点:类似C语言,上手容易,灵活。大小写敏感。在写激励和建模方面有优势。 缺....
发表于 2021-08-20 10:03? 68次阅读
FPGA、Verilog HDL与VHDL的优缺...

北鲲云计算平台为药物研发提供有力支撑

近年来,随着中国科技的飞速发展,云计算已成为当前最具前沿的一项新兴技术,被广泛应用于生命科学、芯片设....
发表于 2021-08-20 09:42? 41次阅读
北鲲云计算平台为药物研发提供有力支撑

NVDIA第三季度数据中心营收预计大增 分析师看...

据外媒报道,英伟达(Nvidia) 周三公布强劲财报与优于预期的财测后, 近半数的分析师提高目标价,....
发表于 2021-08-20 09:05? 333次阅读
NVDIA第三季度数据中心营收预计大增 分析师看...

一文看懂FPGA行业 5G技术更新迭代 驱动FP...

作者:国信证券
发表于 2021-08-19 17:20? 838次阅读
一文看懂FPGA行业 5G技术更新迭代 驱动FP...

FPGA、Verilog HDL与VHDL的利弊

Verilog HDL 优点:类似C语言,上手容易,灵活。大小写敏感。在写激励和建模方面有优势。 缺点:很多错误在编译...
发表于 2021-08-19 16:07? 0次阅读
FPGA、Verilog HDL与VHDL的利弊

词典笔热度再加磅,百度&阿尔法蛋...

8月18日,“AI这时代 星辰大海——百度世界2021”大会在线上召开,会上,小度作为百度旗下软硬件....
发表于 2021-08-19 12:17? 197次阅读
词典笔热度再加磅,百度&阿尔法蛋...

百度世界大会2021的智能时代启示录 没有捷径的...

过去一年里,借“新技术革命”实现超车、摆脱“卡脖子”困境,是国人对中国科技的迫切期待,也成为中国科技....
发表于 2021-08-19 12:01? 839次阅读
百度世界大会2021的智能时代启示录 没有捷径的...

如何解决FPGA引脚与LVDS信号相连时兼容性的...

很多工程师在使用Xilinx开发板时都注意到了一个问题,就是开发板中将LVDS的时钟输入(1.8V电....
发表于 2021-08-19 10:08? 712次阅读
如何解决FPGA引脚与LVDS信号相连时兼容性的...

Dialog半导体公司推出针对高性能汽车AI S...

DA914X-A器件提供前所未有的高达40A的电流等级,相对于同时需要电源控制器和分立式FET的电源....
发表于 2021-08-19 09:07? 350次阅读
Dialog半导体公司推出针对高性能汽车AI S...

智能电话机器人的应用可帮助我们解决一些难题

随着人工智能的快速发展,越来越多的智能产品出现在我们的日常生活中,很多人会问,人工智能的发展对人类有....
发表于 2021-08-18 18:03? 73次阅读
智能电话机器人的应用可帮助我们解决一些难题

对于电话机器人我们该如何做出正确的选择

AI智能目前已经成为发展最快的科学领域之一,也得到了广泛的社会关注,随着一款新型产品——电话机器人的....
发表于 2021-08-18 17:58? 89次阅读
对于电话机器人我们该如何做出正确的选择

热资本下的冷思考,国产GPU挑战与机遇并存

 GPU自诞生以来,就瞄向类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净的计算环境。
发表于 2021-08-18 17:40? 578次阅读
热资本下的冷思考,国产GPU挑战与机遇并存

如何实现两块FPGA之间的通信总结

1、两块fpga之间采用12根线连接,包括8根数据线,2根同步时钟线,2根使能信号线。 2、每块fpga的引脚配置为[3:0]...
发表于 2021-08-18 16:58? 235次阅读
如何实现两块FPGA之间的通信总结

iqoo8pro值得入手吗 优缺点有哪些

昨日晚间,iQOO 8系列正式发布 ,售价3799元起。iQOO此次一共发布了iQOO8和iQOO8....
发表于 2021-08-18 16:47? 1177次阅读
iqoo8pro值得入手吗 优缺点有哪些

全能科技旗舰荣耀Magic3系列赋活《千里江山图...

8月18日,荣耀Magic3系列携手中国国家地理、天猫超级品牌日赋活《千里江山图》的视频震撼上线。视....
发表于 2021-08-18 15:36? 132次阅读
全能科技旗舰荣耀Magic3系列赋活《千里江山图...

FPGA入门:表面现象揭秘——逻辑关系

神奇的0和1,缘何能够如此的变化多端?从某种意义上看,无非就是数字本身固有的各种各样的逻辑关系在使然。在今天的数...
发表于 2021-08-18 14:45? 0次阅读
FPGA入门:表面现象揭秘——逻辑关系

RISC-V CON China在线研讨会:818 RISC-V 如何成为芯主流

会议地址: 中奖公示:第一轮:【RISC-V中国峰会】 定制T恤 收货地址填写: 开源指令集架构(ISA) R...
发表于 2021-08-18 13:55? 202次阅读
RISC-V CON China在线研讨会:818 RISC-V 如何成为芯主流

曙光人工智能指定教材顺利出版

随着人工智能在教育、金融、医疗等诸多领域的广泛和深度应用,已经显露出AI服务社会、经济的价值。人工智....
发表于 2021-08-18 11:48? 358次阅读
曙光人工智能指定教材顺利出版

安晟培半导体通过AI推理应用程序进一步增强 Am...

中国,北京(2021 年 8 月 5 日)——安晟培半导体科技有限公司(Ampere Computi....
发表于 2021-08-18 11:38? 969次阅读
安晟培半导体通过AI推理应用程序进一步增强 Am...

阿尔法蛋AI词典笔T10,凭何用AI力量革新行业...

近年来,随着人工智能与教育场景深度融合,“AI+教育”正推动教育领域的深刻变革。课堂答疑、监考判卷、....
发表于 2021-08-18 11:22? 23次阅读
阿尔法蛋AI词典笔T10,凭何用AI力量革新行业...

百度世界大会2021直播在哪看

百度世界大会2021直播在哪看?
发表于 2021-08-18 10:33? 1765次阅读
百度世界大会2021直播在哪看

FPGA新产品:带RISC-V硬核的FPGA系统...

不久前,Microchip发布新闻稿介绍了其新的中等带宽现场可编程门阵列(FPGA)和FPGA系统级....
发表于 2021-08-18 10:07? 1678次阅读
FPGA新产品:带RISC-V硬核的FPGA系统...

逻辑层接口的IO口如何使用

上篇博文:【FPGA】SRIO IP核系统总览以及端口介绍(一)(User Interfaces 之....
发表于 2021-08-18 09:35? 484次阅读
逻辑层接口的IO口如何使用

【TFT-LCD学习记录2】 R61509V3 彩屏 FPGA 驱动程序设计 精选资料推荐

1 程序说明2 用 matlab 产生  .coe 文件3...
发表于 2021-08-18 06:47? 0次阅读
【TFT-LCD学习记录2】 R61509V3 彩屏 FPGA 驱动程序设计  精选资料推荐

嵌入式软件开发工程师与FPGA开发工程师 精选资料分享

我是一名初入职场的萌新,工作不久从嵌入式软件工程师转到了FPGA工程师,这篇文章简单讲讲两者的区别。嵌入式软件...
发表于 2021-08-18 06:37? 0次阅读
嵌入式软件开发工程师与FPGA开发工程师  精选资料分享

世优科技专注快速动画研究,已累计复活300个虚拟...

成立于2017年的Superplastic,通过运营一系列的虚拟偶像,全网粉丝超过500万,2020....
发表于 2021-08-17 17:47? 36次阅读
世优科技专注快速动画研究,已累计复活300个虚拟...

旷视科技成立人工智能物流产业联盟 实现实体产业数...

最近出版的《人民日报》,聚焦旷视科技服务无锡服装企业梦燕的创新故事,折射出人工智能与物联网加速融合,....
发表于 2021-08-17 16:34? 1282次阅读
旷视科技成立人工智能物流产业联盟 实现实体产业数...

公路病害检测有了“智慧眼”,思谋AI“助力”广东...

近日,思谋科技与广东省某高速企业达成合作,智慧交通一体化平台病害检测模块已成熟落地,将使广东省高速公....
发表于 2021-08-17 16:12? 627次阅读
公路病害检测有了“智慧眼”,思谋AI“助力”广东...

FPGA厂商京微齐力入选北京市2021年度第三批...

日前,北京市经济和信息化局发布了关于对北京市2021年度第三批拟认定“专精特新”中小企业名单进行公示....
发表于 2021-08-17 16:02? 935次阅读
FPGA厂商京微齐力入选北京市2021年度第三批...

可编程逻辑器件随着半导体集成电路的4个阶段

可编程逻辑器件伴随着半导体集成电路的发展而不断发展,其发展可以划分为以下4个阶段。
发表于 2021-08-17 09:16? 1760次阅读
可编程逻辑器件随着半导体集成电路的4个阶段

CIC抽取滤波器MATLAB仿真和FPGA实现

CIC抽取滤波器MATLAB仿真和FPGA实现(1)设计理想滤波器目标:1、滤波器在有效频段内纹波满足设计要求。...
发表于 2021-08-17 08:27? 0次阅读
CIC抽取滤波器MATLAB仿真和FPGA实现

Open Images Extended合集中引...

发布人:Google Research 软件工程师 Candice Schumann 和 Susan....
发表于 2021-08-16 17:20? 273次阅读
Open Images Extended合集中引...

SoC开发者将要面临哪些挑战

高性能计算中,计算、存储、网络三大部件不可或缺。长久以来,追求更高的算力一直是产业的主要创新方向。如....
发表于 2021-08-16 17:02? 1024次阅读
SoC开发者将要面临哪些挑战

如何构建医院后勤智能管理系统

由于我国医疗信息化建设起步较晚,资金支持不足,缺乏统筹规划等,与世界平均水平相比还有较大差距,尤其是....
发表于 2021-08-16 15:53? 41次阅读
如何构建医院后勤智能管理系统

基于FPGA 的CRC校验码生成器

发表于 2021-08-16 15:37? 202次阅读
基于FPGA 的CRC校验码生成器

澎峰Artix 7 FPGA开发套件新品上线 奉...

新款的RV开发板,已经新鲜出炉啦!这次带来的 Perf-V1开发板 ,既可以学习 FPGA编程 ,也....
发表于 2021-08-16 14:18? 1807次阅读
澎峰Artix 7 FPGA开发套件新品上线 奉...

oppo enco air耳机怎么样?拆解评测 ...

耳机外壳是由胶以及四周的卡扣固定。利用撬片,沿着耳机机身合模的位置撬开。主板上有透明塑料盖保护,后盖....
发表于 2021-08-16 11:10? 2300次阅读
oppo enco air耳机怎么样?拆解评测 ...

云天励飞聚焦视觉人工智能技术和产品研发AI解决方...

上海证券交易所网站更新最新信息,AI企业云天励飞上会通过。过去一段时间,AI企业科创上市接连受挫,依....
发表于 2021-08-16 11:08? 818次阅读
云天励飞聚焦视觉人工智能技术和产品研发AI解决方...

乐鑫科技物联网ESP32-C3芯片进入测试及软件...

公司的研发是软硬件双轮驱动,除以上芯片设计方面,还不断在软件技术上进行投入,围绕AIoT 的核心,覆....
发表于 2021-08-16 10:27? 739次阅读
乐鑫科技物联网ESP32-C3芯片进入测试及软件...

如何帮助半导体开发实现基于模型设计芯片的完整流程

MATLAB 和 Simulink 方便了半导体器件的设计空间探索和自顶向下的设计,使工程师们能够相....
发表于 2021-08-16 10:09? 259次阅读
如何帮助半导体开发实现基于模型设计芯片的完整流程

浅谈集成FPGA的两种方式:eFPGA(SoC)...

目前流行的两种集成方案分别是embedded FPGA(以下简称eFPGA集成方案)以及FPGA C....
发表于 2021-08-16 09:53? 1278次阅读
浅谈集成FPGA的两种方式:eFPGA(SoC)...

FPGA的特点和优势

基于上述特点,FPGA芯片早期作为ASIC芯片的半定制化电路替代品应用于部分场景中,近年来,随着微软....
发表于 2021-08-16 09:20? 186次阅读
FPGA的特点和优势

安防芯片涨价50%!海思退、群雄起,10多家厂商...

电子发烧友网报道(文/黄晶晶)安防芯片原本是一个高度集中的市场,由于海思缺芯短期内得不到缓解,它逐渐....
发表于 2021-08-16 08:18? 1994次阅读
安防芯片涨价50%!海思退、群雄起,10多家厂商...

京东方全系列8K超高清显示屏助力央视实现全球首次...

京东方智能公交站牌不受天气影响,烈日暴晒也能清晰显示,风吹雨淋也不会生锈模糊,全勤营业。
发表于 2021-08-14 10:52? 2530次阅读
京东方全系列8K超高清显示屏助力央视实现全球首次...

Lattice基于三星28nm FD-SOI平台...

Lattice基于三星28nm FD-SOI平台推出了一系列FPGA产品,包括在嵌入式视频方面应用比....
发表于 2021-08-14 10:07? 2522次阅读
Lattice基于三星28nm FD-SOI平台...

FPGA与GPU计算存储单位功耗性能

为了提升计算基础设施的性能,并紧跟数据分析与 AI 不断攀升的需求,众多企业将硬件加速视为主要的解决....
发表于 2021-08-13 17:45? 3433次阅读
FPGA与GPU计算存储单位功耗性能

剖析GPU分支分歧对性能的影响

在先前文章中,我们谈到现代GPU发展出SIMT(Single Instruction Multipl....
发表于 2021-08-13 16:07? 186次阅读
剖析GPU分支分歧对性能的影响

Xilinx Vivado 2017.2安装教程

发表于 2021-08-13 15:47? 202次阅读
Xilinx Vivado 2017.2安装教程

NVIDIA发力人工智能 AI推动医疗步入新纪元

人工智能的最终目的是让人类更好地生活。AI技术与医疗产业相结合,可以帮助人类更加精准地筛查疾病、优化....
发表于 2021-08-13 15:21? 3092次阅读
NVIDIA发力人工智能 AI推动医疗步入新纪元

什么是 SOM (System-on-Modul...

什么是 SOM (System-on-Module)? SOM (System-on-Module)....
发表于 2021-08-13 14:20? 231次阅读
什么是 SOM (System-on-Modul...

使用28335与fpga通信传输数据到fpga中隔两个数据重复传输,丢失两个数据

使用28335dma和xintf 传输0-31数到fpga ep4e6 fifo中,数据了每隔两个重复一次,丢失两个数据,如图,请大神帮忙看看那...
发表于 2021-08-13 11:47? 202次阅读
使用28335与fpga通信传输数据到fpga中隔两个数据重复传输,丢失两个数据

NVIDIA研究团队凭借数字化身荣获“最佳展示”...

在一场演示盛宴中,NVIDIA 研究人员为数字化身技术作品注入了四个 AI 模型,在 SIGGRAP....
发表于 2021-08-13 11:41? 240次阅读
NVIDIA研究团队凭借数字化身荣获“最佳展示”...

NVIDIA发布RTX A2000 GPU加速设...

全新RTX A2000 GPU采用小巧、节能的设计,适用于更多台式机,同时加速设计工作流程中的AI和....
发表于 2021-08-13 11:06? 2258次阅读
NVIDIA发布RTX A2000 GPU加速设...

NVIDIA研究团队分享了实时路径追踪和内容创建...

NVIDIA在夏季的多场顶级图形大会上展示其如何为艺术家、创作者和游戏玩家推动实时路径追踪和内容创作....
发表于 2021-08-13 10:59? 215次阅读
NVIDIA研究团队分享了实时路径追踪和内容创建...

如何利用AI追踪或研究大型的小动物群落

研究动物有多种原因,无论是为了医学研究还是为了更深入地了解它们的行为。特别是斑马鱼,它们不仅可用性高....
发表于 2021-08-13 10:54? 1692次阅读
如何利用AI追踪或研究大型的小动物群落

如何利用运行在NVIDIA的EGX平台上的NVI...

在我们的物理空间中,对自动化,提高运营效率和安全性的呼声之高前所未有。大约有10亿个摄像头 -物联网....
发表于 2021-08-13 10:45? 151次阅读
如何利用运行在NVIDIA的EGX平台上的NVI...
一夜七次郎/61794视频在线播放/欧美成年性色生活片/第九色区a天堂