您现在所在的位置: » 太栗网>科技>专注FPGA图像加速领域 深维科技跨入发展快车道

专注FPGA图像加速领域 深维科技跨入发展快车道

2019-11-08 09:41:00 阅读量:1190

最近,在2019年Celeste开发者大会(美洲)上,Deep Dimension Technology正式向世界发布了三款轰动一时的图像加速产品:全球最快的jpeg2jpeg缩略图方案、超高性能jpeg2webp转码方案和全球超高密度计算能力jpeg2jpeg缩略图方案。新产品发布后,有四个惊喜。同时,神威技术的快速发展也引起了业界的广泛关注。经过三年的发展,这家专注于fpga图像加速的新型尖端公司已经进入全面加速阶段。

世界领先的三款图像加速产品都赢得了大客户

1.世界上最快的jpeg2jpeg缩略图方案

该方案主要应用于手机云相册、云存储等领域,可提供高达20倍的计算能力(与cpu方案相比)。也就是说,对于相关服务的服务器集群,采用该方案后,一台cpu服务器(配置有alveou200加速卡)最多可以替换20台相同型号的cpu服务器。执行相同功能和计算能力的服务器集群可以将功耗降低10倍。它的出现大大降低了数据中心的购买成本和运营成本。同时,服务器的服务响应延迟可以降低到以前的5%,并且可以实时调整各种手机终端型号和尺寸,从而大大提高了用户体验。

2.超高性能jpeg2webp转码方案

由于webp可以比jpeg格式多节省25%-34%的数据空间,为了进一步节省网络流量和数据存储,webp格式在行业中得到广泛和大量的应用。然而,由于算法的高度复杂性,webp的编码和解码操作是一个沉重的负担。作为一种超高性能jpeg2webp转码方案,thunderimage jpeg2webp(m4)的速度比是2u e5-2680v4的10倍。也就是说,一台2u e5-2680v4服务器(配有alveou200加速卡)可以用相同的cpu型号替换多达10台服务器。同时,服务响应时间缩短了9倍,客户体验显著改善。

“webp在行业中有广泛的应用,如电子商务、社交媒体、新媒体和视频媒体。thunderimage jpeg2webp的部署量将非常惊人,这可能会改变人们对图像处理的看法。”申威科技的创始人兼首席执行官范平这样说。

3.具有超高密度计算能力的世界级jpeg2jpeg缩略图方案

Thunderimage jpeg2jpeg u50是基于selings alveo u50加速平台的最新产品。在相同的物理空间下,一个阀u200的空间等于两个阀u50的占用空间。该方案将提供高达24倍的加速比,也就是说,对于相关服务的服务器集群,可以使用一台cpu服务器,并且该方案可以替换同一型号的多达24台cpu服务器。然而,由于alveo u50的hbm的高带宽能力,该方案的响应延迟缩短到cpu的4%。从数据的角度来看,thunderimage jpeg2jpeg u50是一款世界级的超高密度计算能力解决方案,适用于具有高计算能力密度的缩略图生成集群。

范平表示,由于这三种产品的独特优势,神威科技已经就上述三种新产品与国内外六家知名互联网公司达成了合作意向,多家公司已经明确表达了浓厚的兴趣,目前正处于合作谈判阶段。

公认的图像处理最佳实践:fpga异构计算

根据相关数据和研究结果,摩尔定律自2005年以来逐渐加速和减速,尤其是近年来。然而,随着移动互联网、大数据、5g应用、物联网和人工智能应用的快速发展,数据中心的计算能力需求也爆炸式增长。

在摩尔定律失效的情况下,提高数据中心的计算能力,以满足日益增长的业务处理需求,已经成为数据中心面临的主要挑战。目前,业界主流的计算能力增强方案不过是以gpu、fpga和asic为核心的异构计算方案。

由于gpu、fpga和asic具有不同的计算力特性,它们在处理不同的计算类型和场景时有各自的优势。Gpu属于冯·诺依曼(Von Neumann)结构,具有高并发性和灵活性的特点,但也存在高能耗和实时性差的缺点。Asic和fpga的能效稍高,主要是因为它们的架构没有指令,不需要共享内存。Asic是一种专门为特定需求定制的芯片。它体积小、功耗低、计算性能和效率高,但算法调整极其困难,适用于固定算法和大规模应用计算场景。

Fpga介于两者之间。它具有低延迟、低功耗、可编程灵活性高、开发周期短的特点,支持后期调整和升级。因此,fpga具有独特的优势,巨大的市场空间和潜力,如图像处理。基于这一判断,深维技术自成立以来一直专注于fpga领域。申威科技创始人兼首席执行官范平表示:“fpga异构计算市场将是一个1000亿美元的市场。未来,神威科技将继续专注于图像和视频处理、大数据处理和高性能计算领域。”

编程困难,设计复杂,还有fpga应用的“盖板”。

虽然fpga具有明显的优势和巨大的市场空间,但其实际应用存在相当高的技术壁垒。首先,很难编程。鉴于rtl编程的复杂性和低效性,hls设计不够成熟,编译时间长,调试困难。其次,硬件系统设计复杂,异构计算系统的复杂性要求软件栈的定制。因此,业界普遍认为fpga应用的开发周期以“年”为单位,并面临最终产品性能不理想的风险。这导致许多科技公司对fpga“望而却步”。

然而,神威科技作为一颗“冉冉升起的新星”,已经优雅地解决了这两个问题。在不到一年的时间里,它成功地相继推出了三款形象加速颠覆性产品,每款产品的平均研发周期不到三个月。

深尺寸技术:一种基于vitis的高级fpga设计方法模型

产品研发速度快,效果好。神威科技是如何做到的?

范平认为有三个原因。首先,强大的eda团队和相关技术背景使fpga应用程序开发变得容易。二是开发eda辅助工具,在极端情况下可以发挥关键作用。第三是依靠团队的高效组织和高昂的士气。

就团队基因而言,深度维度技术(Deep Dimension Technology)的核心技术成员交叉覆盖了图像视频应用算法和fpga核心技术。大部分团队来自凯登丝、ibm、微软研究院、北京威亚、中国科学院、复旦微电子等。他们在行业理解和产品工程能力方面具有优势。它们在fpga芯片架构设计与评估技术、fpga eda工具算法、高性能算法等方面有着深厚的积累。

但是,由于核心团队对fpga芯片架构和eda工作机制有着深刻的理解,在开发过程中,首先采用c/c语言进行开发,一方面可以支持大规模算法,另一方面提高芯片架构的灵活性,从而缩短修改周期。其次,自主开发的开发工具,包括fpga设计工具、调试工具、标准化专用系统设计工具等。,以确保产品的性能。

在这次xfd会议上,selings fpga软件开发副总裁dan gibbons在他关于vitis开发者和生态学的专题报告中把深度技术作为一个成功的案例。他详细介绍了深维技术的产品和技术,并高度评价了深维技术的图像处理产品的性能,称“深维技术是基于vitis的高级fpga设计方法的一个很好的展示”。

丹·吉本斯,塞林西fpga软件开发副总裁,xdf2019

“目前,我们的研发效率和效果已经在行业中处于明显领先地位,图像处理产品已经得到许多客户的认可。未来,我们将根据产品计划,分批推出更多轰动一时的视频处理和分析方案、高性能计算方案和大数据方案。”范平对新产品和新的未来充满信心。

在fpga图像加速领域,深度技术已经进入快速发展的快车道。未来,我们将拭目以待,看看我们能否保持在这个领域的领先优势,并继续探索新的领域。

资料来源:中国金融Times.com。

关注通化顺金融微信公众号(ths518),获取更多金融信息

快三彩票 上海时时乐开奖结果 快乐十分钟开奖结果 内蒙古11选5投注 黑龙江十一选五开奖结果