电子发烧友网>可编程逻辑> > 正文

Xilinx赋能深维科技GIF2WebP动图方案重新定义图像处理未来

2021年08月20日 11:52 ? 次阅读

Xilinx? Alveo? U200加速卡助力深维科技 (DeePoly)ThunderImage转码解决方案提供创新的多媒体演示体验

移动互联网技术的发展和海量内容的的爆炸性增长,驱使内容服务提供商使用大量动画图形推广自己的内容。尽管GIF仍然是网络上常用的动图格式,但是因为其相比静态图片更大的尺寸及编解码技术,常常会因为网速及编解码计算性能等问题,导致不佳的用户体验,有时甚至导致内容不可用。WebP动画图形处理是GIF的绝佳替代方案,但是其高度复杂的计算及其造成的过高的时延,使得该方案缺乏可行性的技术支持。

为了解决WebP动图转码的时延问题,深维科技选择赛灵思Alveo? U200加速卡打造了其ThunderImage GIF2WebP动图转码解决方案,使得内容提供商拥有了前所未有的网络多媒体演示体验。

图1:基于深维ThunderImage GIF2WebP动图转码解决方案的转码流程演示

市场挑战

随着移动互联网内容的爆发性增长,越来越多的互联网内容服务商开始在网页上大量使用更加生动直观的动图来吸引用户的眼球,以为用户提供更鲜活浏览体验,并同时更有效地推荐相关产品。

尽管目前网络上主流动图格式仍然是GIF。但最新一版GIF规范制定于32年前(1989年),当今的软硬件环境较当年已经发生了天翻地覆的变化,GIF文件特有的占用空间大、色彩表现力有限、终端解码效率差等问题,显得越发突出,导致动图相关功能网络带宽占用大、终端解码负担重,并最终使APP用户体验变差甚至完全不可用。

为解决GIF动图存在的问题,新的动图格式WebP应运而生。WebP的优势非常明显,包括大幅缩小文件大小,节省网络流量,降低传输时延。在不做缩放的情况下,转换为WebP动图将可以节省50% 以上的空间。而对于带缩放的场景,同分辨率WebP动图相比GIF平均可节省62%的空间(根据我们采样的小规模数据)。此外,WebP动图相比GIF,在画质上也实现了显著提升,同分辨率文件大小可缩减75%。

图2:根据我们采样的小规模数据,同分辨率的WebP图像比GIF平均节省62%的空间

然而,虽然WebP 解决了尺寸和图像质量的问题,其时延问题却是阻碍其普及的最大障碍之一。 WebP动图相当于几十至上百张WebP静图的编码, 计算复杂度非常高,导致此转码运算时延会非常惊人。使用最快的开源算法在CPU上运行,转码运算时延动辄十几秒,这样用户的体验会非常差。

解决方案

针对WebP动图转码时延过大的问题, 深维科技选择采用赛灵思Alveo? U200加速卡打造了ThunderImage GIF2WebP动图转码方案。 Alveo U200 基于赛灵思16 nm UltraScale? 架构,旨在为包括机器学习推断、视频转码和数据库搜索与分析在内的数据中心重要工作负载,提供当前 CPU 无法实现的性能。借助Alveo U200,深维科技基于该平台一次性解决了时延、流量、存储、计算等问题。

图: ThunderImage GIF2WebP方案

深维科技CEO 樊平表示:“赛灵思高性能的异构处理平台,助力ThunderImage GIF2Webp方案全面解锁了WebP动图画质高、体积小的优势,为广大的互联网内容服务商带来了多媒体展示的全新体验。”

具体而言,ThunderImage GIF2Webp动图转码方案实现了:

1.超低时延

对比CPU方案,ThunderImageGIF2WebP动图转码方案将转码处理时延 ( 端到端的单张图像处理时延 ) 平均缩减15倍。即从十几秒到几十秒缩短到零点几秒到1秒多,这种场景下的WebP动图技术就从原来的不可行变成了完全可行。 ( 注:测试基准CPU为Xeon E5-2680v4双核、内存为256GB DDR4。测试输入为1000张GIF动图,输出为400x400 WebP动图。测试数据基于Xilinx Alveo U200加速卡。)

2.全新画质体验

由于WebP相较于GIF强大的压缩能力和色彩表现能力(24bit vs 8bit),相较于GIF方案ThunderImage GIF2Webp可以呈现远比前者更细腻、更高清的画质体验。

3.超高鲁棒性

在业务极限载荷的情形下,GIF2WebP转码处理时延较常规时延波动不超过10%,从而有效提升服务可靠性。

4.低功耗

方案充分利用赛灵思加速卡低功耗特点,相较CPU的GIF2WebP方案,为客户节省10%以上的能耗。

5.流量节省

相较GIF方案,此方案可以立即为用户节省50%以上的网络流量。

6.小尺寸

相较CPU的GIF2WebP方案,客户可节省10%以上的物理空间。

图3:实测结果,400*400延迟,平均比CPU方案降低15倍

设计成效

2021年1月,深维科技ThunderImage GIF2Webp动图转码方案作为国内首款基于高性能FPGA异构计算的SaaS动图转码产品,正式上线阿里云市场。甫一上市,已经开始为国内领先影视类视频提供商南瓜电影的影片动态海报功能提供服务。

南瓜电影COO庄徐麟表示:“南瓜有大量优秀影片,因为没有有效的方法使之在节目清单中脱颖而出,错失了被用户注意的机会,非常的可惜。这是我们一直想要解决的一个问题。采用深维科技的GIF2WebP动图方案以后,我们就能够使用播放时间充裕、画质高清的动图了。通过这种方式展示推荐影片给用户,可以帮助用户快速预览,从而显著提高观影概率。”

除影片推荐外, ThunderImage GIF2Webp还有望在UGC视频、电子商务、兴趣社群、手机动态屏保、社交媒体等众多领域被广泛应用。

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

FPGA与GPU计算存储加速对比:单位功耗性能考...

使用或者不使用机器学习辅助的分析以及验证,都可以借助计算存储器件进行加速。
发表于 2021-08-20 11:57? 0次阅读
FPGA与GPU计算存储加速对比:单位功耗性能考...

FPGA、Verilog HDL与VHDL的优缺...

Verilog HDL 优点:类似C语言,上手容易,灵活。大小写敏感。在写激励和建模方面有优势。 缺....
发表于 2021-08-20 10:03? 53次阅读
FPGA、Verilog HDL与VHDL的优缺...

IIC简介

1:IIC简介IIC:(Inter_integrated circuit),两线式串行总线,它是由数据线SDA和时钟SCL构成的串行总线,...
发表于 2021-08-20 07:14? 0次阅读
IIC简介

DMA介绍

标准库3.5实现:《嵌入式-STM32开发指南》第二部分 基础篇 - 第7章 DMA7.1 DMA工作原理7.1.1 DMA介绍DM...
发表于 2021-08-20 07:02? 0次阅读
DMA介绍

一文看懂FPGA行业 5G技术更新迭代 驱动FP...

作者:国信证券
发表于 2021-08-19 17:20? 779次阅读
一文看懂FPGA行业 5G技术更新迭代 驱动FP...

FPGA、Verilog HDL与VHDL的利弊

Verilog HDL 优点:类似C语言,上手容易,灵活。大小写敏感。在写激励和建模方面有优势。 缺点:很多错误在编译...
发表于 2021-08-19 16:07? 0次阅读
FPGA、Verilog HDL与VHDL的利弊

stm32单片机的基本组成是什么

stm32是一款高性能、低成本、低功耗、可裁剪的嵌入式单片机。那么stm32单片机的基本组成是什么呢....
发表于 2021-08-19 15:47? 130次阅读
stm32单片机的基本组成是什么

如何解决FPGA引脚与LVDS信号相连时兼容性的...

很多工程师在使用Xilinx开发板时都注意到了一个问题,就是开发板中将LVDS的时钟输入(1.8V电....
发表于 2021-08-19 10:08? 702次阅读
如何解决FPGA引脚与LVDS信号相连时兼容性的...

定时器分为哪几种

定时器分为硬件定时器和软件定时器,几乎所有的微控制器上都配备了数量有限的硬件定时器,即控制器本身有专门实现定时...
发表于 2021-08-19 09:08? 0次阅读
定时器分为哪几种

STM32系列的CPU定时器作用

STM32系列的CPU,有多达8个定时器。1、 其中TIM1和TIM8是能够产生三对PWM互补输出的髙级定时器,常用于...
发表于 2021-08-19 08:44? 0次阅读
STM32系列的CPU定时器作用

STM32自带的bxCAN有何功能

STM32 自带的是 bxCAN,即基本扩展 CAN。它支持 CAN 协议 2.0A 和 2.0B。它的设计目标是,以最小的 CP...
发表于 2021-08-19 07:45? 0次阅读
STM32自带的bxCAN有何功能

手把手教你在Ubuntu系统中通过QEMU来运行基于Arm CPU的Linux系统

怎样去安装QEMU? 如何去编译U-Boot? 怎样在Ubuntu系统中通过QEMU来运行基于Arm CPU的Linux系统?...
发表于 2021-08-19 06:57? 0次阅读
手把手教你在Ubuntu系统中通过QEMU来运行基于Arm CPU的Linux系统

STM32的时钟系统

众所周知,时钟系统是 CPU 的脉搏,就像人的心跳一样。所以时钟系统的重要性就不言而喻了。   STM32 ...
发表于 2021-08-19 06:27? 0次阅读
STM32的时钟系统

如何实现两块FPGA之间的通信总结

1、两块fpga之间采用12根线连接,包括8根数据线,2根同步时钟线,2根使能信号线。 2、每块fpga的引脚配置为[3:0]...
发表于 2021-08-18 16:58? 235次阅读
如何实现两块FPGA之间的通信总结

工控机CPU与PC的CPU有什么不同

本期上海研强给大家分享的是为什么工控机CPU需要用到高速缓存,希望看完本篇文章您能对工控机有一个全新....
发表于 2021-08-18 16:26? 240次阅读
工控机CPU与PC的CPU有什么不同

FPGA入门:表面现象揭秘——逻辑关系

神奇的0和1,缘何能够如此的变化多端?从某种意义上看,无非就是数字本身固有的各种各样的逻辑关系在使然。在今天的数...
发表于 2021-08-18 14:45? 0次阅读
FPGA入门:表面现象揭秘——逻辑关系

FPGA新产品:带RISC-V硬核的FPGA系统...

不久前,Microchip发布新闻稿介绍了其新的中等带宽现场可编程门阵列(FPGA)和FPGA系统级....
发表于 2021-08-18 10:07? 1629次阅读
FPGA新产品:带RISC-V硬核的FPGA系统...

逻辑层接口的IO口如何使用

上篇博文:【FPGA】SRIO IP核系统总览以及端口介绍(一)(User Interfaces 之....
发表于 2021-08-18 09:35? 463次阅读
逻辑层接口的IO口如何使用

FPGA厂商京微齐力入选北京市2021年度第三批...

日前,北京市经济和信息化局发布了关于对北京市2021年度第三批拟认定“专精特新”中小企业名单进行公示....
发表于 2021-08-17 16:02? 917次阅读
FPGA厂商京微齐力入选北京市2021年度第三批...

可编程逻辑器件随着半导体集成电路的4个阶段

可编程逻辑器件伴随着半导体集成电路的发展而不断发展,其发展可以划分为以下4个阶段。
发表于 2021-08-17 09:16? 1726次阅读
可编程逻辑器件随着半导体集成电路的4个阶段

通过 TensorFlow模型优化工具包TF M...

发布人:Yunlu Li 和 Artsiom Ablavatski 简介 剪枝是 TensorFlo....
发表于 2021-08-16 17:26? 1095次阅读
通过 TensorFlow模型优化工具包TF M...

造成工控机故障的因素有哪些

了解过工控机的用户应该都了解工控机的性能是非常不错的,可在一些恶劣的环境下进行工作。虽然有着不错的性....
发表于 2021-08-16 16:44? 267次阅读
造成工控机故障的因素有哪些

澎峰Artix 7 FPGA开发套件新品上线 奉...

新款的RV开发板,已经新鲜出炉啦!这次带来的 Perf-V1开发板 ,既可以学习 FPGA编程 ,也....
发表于 2021-08-16 14:18? 1790次阅读
澎峰Artix 7 FPGA开发套件新品上线 奉...

计算机系统中线程切换是怎么实现的

计算机系统中有很多程序员习以为常但又十分神秘的存在:函数调用、系统调用、进程切换、线程切换以及中断处....
发表于 2021-08-16 11:40? 200次阅读
计算机系统中线程切换是怎么实现的

编程语言讲解 聪明的笨蛋CPU

聪明的人类发现把简单的开关组合起来可以表达复杂的bool逻辑,在此基础之上构建了 CPU ,因此 C....
发表于 2021-08-16 11:32? 182次阅读
编程语言讲解 聪明的笨蛋CPU

一种32位Arm架构的微处理器详细介绍

PlasticARM的芯片架构如下图所示。它是一种SoC,包括源自32位Arm Cortex-M0+....
发表于 2021-08-16 11:04? 1225次阅读
一种32位Arm架构的微处理器详细介绍

你们知道为什么要分库分表吗

在文章开头先抛几个问题: (1)什么时候才需要分库分表呢?我们的评判标准是什么? (2)一张表存储了....
发表于 2021-08-16 10:37? 111次阅读
你们知道为什么要分库分表吗

如何帮助半导体开发实现基于模型设计芯片的完整流程

MATLAB 和 Simulink 方便了半导体器件的设计空间探索和自顶向下的设计,使工程师们能够相....
发表于 2021-08-16 10:09? 257次阅读
如何帮助半导体开发实现基于模型设计芯片的完整流程

浅谈集成FPGA的两种方式:eFPGA(SoC)...

目前流行的两种集成方案分别是embedded FPGA(以下简称eFPGA集成方案)以及FPGA C....
发表于 2021-08-16 09:53? 1269次阅读
浅谈集成FPGA的两种方式:eFPGA(SoC)...

忆芯科技首款DRAM-Less固态硬盘,搭载自研...

忆芯科技推出了搭载自研STAR1000P主控的DRAM-Less消费级SSD方案STAR1200L,....
发表于 2021-08-16 09:45? 48次阅读
忆芯科技首款DRAM-Less固态硬盘,搭载自研...

FPGA的特点和优势

基于上述特点,FPGA芯片早期作为ASIC芯片的半定制化电路替代品应用于部分场景中,近年来,随着微软....
发表于 2021-08-16 09:20? 186次阅读
FPGA的特点和优势

内存的基本概念以及操作系统的内存管理算法

本文主要介绍内存的基本概念以及操作系统的内存管理算法。 一、内存的基本概念 内存是计算机系统中除了处....
发表于 2021-08-14 14:39? 216次阅读
内存的基本概念以及操作系统的内存管理算法

Lattice基于三星28nm FD-SOI平台...

Lattice基于三星28nm FD-SOI平台推出了一系列FPGA产品,包括在嵌入式视频方面应用比....
发表于 2021-08-14 10:07? 2512次阅读
Lattice基于三星28nm FD-SOI平台...

如何确定闭环步进电机的脉冲周期

做好闭环步进电机速度控制,是保证电机有好的控制,能够能够呈现出好的运行效果发挥出优势功能的重点之一。....
发表于 2021-08-14 10:02? 19次阅读
如何确定闭环步进电机的脉冲周期

如何才能熟练掌握关于for循环

好吧,也许你认为我在写一篇如何使用for循环的文章,,,,首先,我想说无论是学习C语言还是学习jav....
发表于 2021-08-14 09:47? 153次阅读
如何才能熟练掌握关于for循环

FPGA与GPU计算存储单位功耗性能

为了提升计算基础设施的性能,并紧跟数据分析与 AI 不断攀升的需求,众多企业将硬件加速视为主要的解决....
发表于 2021-08-13 17:45? 3414次阅读
FPGA与GPU计算存储单位功耗性能

NVIDIA GPU赋能BroADAS港机智能辅...

案例简介 博大视野(厦门)科技有限公司是业内领先的智慧港口视觉方案提供商。公司为全球港口用户提供坚固....
发表于 2021-08-13 10:08? 247次阅读
NVIDIA GPU赋能BroADAS港机智能辅...

机智云物联网边缘管理系统获适配认证

近日,Gizwits机智云物联网云边协同产品机智云边缘管理系统GEMS V1.0获得统信操作系统及兆....
发表于 2021-08-12 14:38? 2615次阅读
机智云物联网边缘管理系统获适配认证

教大家如何处理x86处理器中MSI-X中断请求

x86处理器如何处理MSI-X中断请求PCIe设备发出MSI-X中断请求的方法与发出MSI中断请求的....
发表于 2021-08-12 11:23? 3030次阅读
教大家如何处理x86处理器中MSI-X中断请求

FPGA中浮点运算定标实现方法

有些FPGA中是不能直接对浮点数进行操作的,只能采用定点数进行数值运算。对于FPGA而言,参与数学运....
发表于 2021-08-12 09:53? 1388次阅读
FPGA中浮点运算定标实现方法

有市无价的宇航级芯片凭什么卖500万一颗?

为何这类宇航级的芯片能卖这么贵呢?就拿XQR5VFX130-1CF1752V来说,该芯片抗辐射能力非....
发表于 2021-08-11 17:16? 4954次阅读
有市无价的宇航级芯片凭什么卖500万一颗?

Microchip推出新型中等带宽FPGA器件,...

Microchip全新低密度PolarFireò器件静态功耗是同类器件的一半,同时提供全球最小的发热....
发表于 2021-08-11 14:16? 582次阅读
Microchip推出新型中等带宽FPGA器件,...

如何理解FPGA中异步复位和同步释放

二级触发器同步后,第二季触发器的输出基本上是稳定值。后续逻辑根据稳定值,会有稳定的行为。这就是追求的....
发表于 2021-08-11 09:14? 2490次阅读
如何理解FPGA中异步复位和同步释放

SSI技术-从概念到现实

Xilinx 3D IC技术简介 跨Die约束?SLR?SSI?这些是使用UltraScale+/V....
发表于 2021-08-10 17:25? 612次阅读
SSI技术-从概念到现实

FPGA的硬件架构和工作原理

一、FPGA的硬件架构和工作原理 1.1早期的PROM技术实现 在上世纪60年代以后,小规模集成电路....
发表于 2021-08-10 16:41? 609次阅读
FPGA的硬件架构和工作原理

锐龙R5和i5哪个好,11代酷睿棋高一着

锐龙R5和i5哪个好? 不管是选购笔记本还是组装台式机时,不少消费者都会在挑选处理器的时候纠结这个问....
发表于 2021-08-10 14:33? 3437次阅读
锐龙R5和i5哪个好,11代酷睿棋高一着

如何用FPGA并行高速运算实现实时的引导滤波算法

前面一篇文章中,已经详细的分析了引导滤波的理论,公式的推导,以及和双边滤波的对比分析,即在边缘的处理....
发表于 2021-08-10 14:27? 176次阅读
如何用FPGA并行高速运算实现实时的引导滤波算法

如何通过软件?无线?电?推进?无线?原型?验证?

Xilinx Zynq UltraScale+ FPGA的可编程逻辑组件拥有的FPGA资源比其他US....
发表于 2021-08-10 11:31? 3038次阅读
如何通过软件?无线?电?推进?无线?原型?验证?

王思聪的“百万电脑”也迷信“AMD YES”?英...

近日,科技圈发生了一件“壕无人性”的事情——王思聪花100万组装了一台电脑。在组装之初,王思聪被问到....
发表于 2021-08-10 10:09? 1477次阅读
王思聪的“百万电脑”也迷信“AMD YES”?英...

基本的时序约束和STA操作流程

一、前言 无论是FPGA应用开发还是数字IC设计,时序约束和静态时序分析(STA)都是十分重要的设计....
发表于 2021-08-10 09:33? 240次阅读
基本的时序约束和STA操作流程

PWM模块在计数过程中可以根据哪三种配置trig...

SWM201系列所有型号PWM操作均相同,不同型号PWM通道数可能不同。使用前需使能PWM模块时钟。....
发表于 2021-08-09 17:53? 363次阅读
PWM模块在计数过程中可以根据哪三种配置trig...

RVBoards~初心始于2018年 教育部产学...

以我们与北京交通大学的RISC-V教育项目合作成果为例介绍。在这里,也特向艾丽华老师表示感谢和祝贺,....
发表于 2021-08-09 17:53? 554次阅读
RVBoards~初心始于2018年 教育部产学...

如何辨别工控机是否出现故障

本期上海研强给大家分享的是如何辨别工控机是否出现故障,希望看完本篇文章您能对工控机有一个全新的认识!
发表于 2021-08-09 17:05? 59次阅读
如何辨别工控机是否出现故障

嵌入式无风工控机的主要特点

本期上海研强给大家分享的是无风扇工控机的特点,希望看完本篇文章您能对无风扇工控机有一个全新的认识!
发表于 2021-08-09 16:56? 87次阅读
嵌入式无风工控机的主要特点

基于VIVADO的PCIE IP的使用

基于VIVADO的PCIE IP的使用 项目简述 上一篇内容我们已经对PCIE协议进行了粗略的讲解。....
发表于 2021-08-09 16:22? 257次阅读
基于VIVADO的PCIE IP的使用

庆祝微处理器诞生黄金五十周年

单芯片处理器是什么时候诞生的?最早商用的处理器是英特尔4004,于1971年上市,距今正好50年。
发表于 2021-08-09 14:21? 479次阅读
庆祝微处理器诞生黄金五十周年

别让CPU背黑锅 aigo国民好物固态硬盘P30...

别让CPU背黑锅 aigo国民好物固态硬盘P3000让电脑瞬间提速 相信很多人都遇到过这样的情况,在....
发表于 2021-08-09 14:13? 149次阅读
别让CPU背黑锅 aigo国民好物固态硬盘P30...

瑞萨电子推出给予智能电表解决方案

智能电表依托A/D转换器对用户电流、电压开展实时采集,经由CPU开展分析处理,实现正反向、峰谷或者四....
发表于 2021-08-09 11:24? 310次阅读
瑞萨电子推出给予智能电表解决方案

FPGA和GPU计算存储加速有啥不一样

为了提升计算基础设施的性能,并紧跟数据分析与 AI 不断攀升的需求,众多企业将硬件加速视为主要的解决....
发表于 2021-08-09 11:00? 2761次阅读
FPGA和GPU计算存储加速有啥不一样

Vitis AI 1.4赋予 AI 产品化更多可...

Vitis AI 1.4 赛灵思 Vitis AI 是一款功能强大的机器学习开发平台,用于在赛灵思自....
发表于 2021-08-09 10:54? 196次阅读
Vitis AI 1.4赋予 AI 产品化更多可...

AlphaFold2在北鲲云高性能计算平台的应用

蛋白质生物细胞内的机器,要想知道“机器”的工作过程,就要先了解其结构和组成。比如说,如果想要知道某个....
发表于 2021-08-09 10:29? 104次阅读
AlphaFold2在北鲲云高性能计算平台的应用

自动驾驶新征程的三大挑战为什么一定是FPGA

综合人工智能、通信、半导体、汽车等多项技术,自动驾驶涉及产业链长、价值创造空间巨大,已成为各国汽车产....
发表于 2021-08-09 09:34? 2851次阅读
自动驾驶新征程的三大挑战为什么一定是FPGA

复位电路的作用是什么

复位电路是一个能让电路回到原本状态的设备,复位电路的操作原理可以说和计算机差不多,不过启动的方式和手....
发表于 2021-08-07 10:53? 442次阅读
复位电路的作用是什么

一种基于FPGA的图神经网络加速器解决方案

GNN算法涉及大量的矩阵计算和存储访问操作。在传统的x86架构服务器上运行这种算法的效率是非常低的,....
发表于 2021-08-06 15:08? 3036次阅读
一种基于FPGA的图神经网络加速器解决方案
一夜七次郎/61794视频在线播放/欧美成年性色生活片/第九色区a天堂