bck

收藏本站

基于FPGA的多路CNN并行计算体系结构研究

【摘要】:卷积神经网络(Convolutional Neural Network,CNN)是人工神经网络的一个重要分支,是近几年随着深度学习概念的提出,才开始广受关注的一种机器学习方法,是一种以卷积运算为核心的神经网络。不同于传统的基于预定义规则的特征提取方法,CNN可以直接从大规模输入图像中“学习”不同特定目标的特征,而不需人工干预,现已广泛应用于目标检测、模式识别、机器视觉、以及大数据视频处理等领域。随着物联网和嵌入式技术的日渐成熟,让终端具有智能的数据判断能力,和智能化的数据采集和实时决策能力,已成为一种趋势,即,智能边缘计算。智能边缘计算中的核心问题就是将智能处理功能迁移到终端。而基于神经网络的机器学习技术,正是使嵌入式设备具有数据识别和智能处理能力的方法。然而,神经网络更高的计算复杂度和计算参数规模将给嵌入式设备带来新的挑战。而现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA),具有高密度并行计算能力和低功耗的特点,正好适合于嵌入式设备对于新型智能化的应用需求,以及在功耗、体积和成本方面的需求,也正是当下深度神经网络计算和优化的主要实验平台。然而,现有的优化研究主要是针对单路CNN模型的优化。而未来,在FPGA集成度不断增大,CNN网络模型不断优化的前提下,在一个FPGA系统中实现多路CNN模型的并行运算,可能会是一种趋势。面向未来嵌入式领域多路CNN模型的并行计算需求,本文深入研究FPGA内部资源的并行计算能力,从最基础的二进制乘法理论为研究的着手点,以多项式代数乘法为分析方法,对FPGA最低层的DSP(Digital Signal Processor)乘法器资源、逻辑资源和存储资源进行并行优化研究。然后结合CNN的计算和数据存储特征展开基于FPGA的多路CNN的并行计算方法研究。最终提出一种高性能、低功耗的多路CNN并行系统设计和实现方法。具体内容如下:(1)针对单个DSP乘法器在低精度乘法计算中的低吞吐量问题,提出了一种基于单个DSP的多路乘法并行计算方法,有效的提高了单DSP乘法器整数或半精度浮点数的乘法计算的吞吐量。该方法以二进制乘法、多项式代数乘法理论为依据,主要是利用DSP乘法器的输入位宽不均匀特性,采用在高位输入中预留空精度位的方法,实现单时钟周期多路乘法的并行计算,包括低精度整数和半精度浮点数的并行计算。针对并行乘法计算过程中部分积求和产生的溢出位问题,提出了一种基于集合理论的求解方法。而后,基于此求解方法,提出了一种面向单个DSP乘法器的多路乘法并行参数搜索算法和并行参数优化模型,实现了对不同乘法有效位的最优并行参数搜索,并验证了该算法和优化模型的有效性。(2)针对现有CNN模型参数量化方法计算误差高,识别精度明显降低的问题,提出了一种双路CNN网络并行计算结构,该结构通过设计一种高效的浮点参数量化方法,支持在单个算法IP中的双路CNN模型的并行计算,通过双路模型的对比识别,可以明显提高FPGA中CNN模型的识别准确率。该量化方法还能够提高系统的计算性能,同时降低系统的资源使用。不同于其它优化方法,本文针对多路CNN的并行计算,以16位半精度浮点数为原型,采用8位精度量化的尾数有效位,支持在单个DSP乘法器上的双路CNN网络参数的并行计算。此外,又提出了一种基于指数分段的半精度浮点数规格化方法,实现同定点数之间的快速格式转换,使模型支持以标准半精度浮点数进行参数训练和输入,不需要额外的数据格式转换操作。采用以上量化方法的CNN模型几乎具有同原浮点模型相同的识别准确度。再有,因为在一个算法IP中同时支持双路不同CNN模型的对比识别,该方法还能够实现比单路原浮点CNN模型更高的识别准确度。(3)针对多路CNN系统DDR参数访问带宽的限制问题,提出了一种多路CNN算法IP的数据共享策略,该策略通过设计一种基于通道广播的参数共享方法,有效的提高了多路CNN算法IP的数据传输效率。该数据共享策略面向DDR存储系统和多路相同CNN算法IP之间的数据搬运,其中,CNN算法IP的网络参数一样。在这种情况下,本文创新性的提出一种基于通道广播的数据共享策略,通过设计并实现一种可配置多路复用DMA IP,利用FPGA中的逻辑资源,将单路DMA数据广播到多路CNN算法IP中,缓解DDR数据访问带宽的瓶颈问题,有效的提高了多路CNN并行系统的数据传输效率。(4)基于以上三个研究内容,提出了一种多路CNN算法IP的并行系统设计框架。主要解决了双并行CNN模型的训练,参数精度量化和并行计算,IP封装和系统集成,以及软件驱动和应用接口等,FPGA软硬系统设计和集成方法的问题。实验表明,本文提出的多路CNN算法IP的并行计算方法,比传统的独享DMA方式,具有更低的系统资源使用率和功耗,同时基于通道广播的参数共享方法可以明显提高多路CNN系统的数据传输效率和系统识别性能。以上研究工作包括多路CNN的并行计算,参数量化和数据共享策略,涵盖了FPGA底层计算资源到多路CNN算法IP整个系统的优化设计和集成方法,希望能够为未来基于FPGA的多路CNN并行优化方法的研究提供支撑和参考。

下载App查看全文

(如何获取全文? 欢迎:、、)

支持CAJ、PDF文件格式


【相似文献】
中国期刊全文数据库 前19条
1 吴靖;;一种用于基因序列比较的并行计算方法[J];国外医学.生物医学工程分册;1992年01期
2 艾明;;面向大数据处理的并行计算模型与性能优化探析[J];信息通信;2020年09期
3 王同科;常慧宾;王彩华;;信息与计算科学专业并行计算人才培养模式研究与实践[J];高师理科学刊;2016年02期
4 李欣;王婷;;MPI并行计算在图像处理方面的应用[J];科学中国人;2017年12期
5 杨学军;;并行计算六十年[J];计算机工程与科学;2012年08期
6 李燕;徐冠;;测控系统的集群并行计算的实现[J];桂林航天工业学院学报;2012年04期
7 余莲;;MATLAB并行计算:让高性能计算资源的利用更加高效[J];电子技术应用;2009年01期
8 姚学礼;;网络并行计算中的负载平衡[J];光盘技术;2008年12期
9 梁丹;冯菊;陈星;;高效率FDTD网络并行计算研究[J];四川大学学报(自然科学版);2006年03期
10 曹卫;并行计算——计算科学与工程的核心[J];上海城市管理职业技术学院学报;2004年S1期
11 戴光明,孟永良;网络并行计算中动态负载平衡的实现[J];计算机工程与应用;1998年10期
12 庄昌文,林晓东,刘心松;实现并行计算的群集系统[J];计算机应用;1998年06期
13 朱福民;;并行计算的软件环境与硬件结构[J];计算机科学;1992年04期
14 王嘉谟;;多项式的并行计算[J];计算机工程与科学;1980年03期
15 林新华;王左利;林新华;;困扰并行计算的三大问题[J];中国教育网络;2008年11期
16 ;大数据分析与并行计算山西省科技创新(重点)团队介绍[J];太原科技大学学报;2020年06期
17 曹伟;;并行计算基础和实际应用[J];辽宁师专学报(自然科学版);2008年03期
18 朱星明;涂彬;陈煜;白婧怡;耿庆斋;;水利科学计算并行计算平台构建及算法实践[J];水利水电技术;2006年08期
19 迟利华,刘杰,胡庆丰;数值并行计算可扩展性评价与测试[J];计算机研究与发展;2005年06期
中国重要会议论文全文数据库 前20条
1 孙明波;汪洪波;杨揖心;熊大鹏;李桦;田正雨;王超;刘旭;刘佩;;基于GPU高效并行计算的高超声速飞行器内外流一体化模拟[A];第十一届全国流体力学学术会议论文摘要集[C];2020年
2 徐圣卓;包芸;谢嘉斌;;野外尺度高Re数湍流风场大涡模拟的高效并行计算[A];第十一届全国流体力学学术会议论文摘要集[C];2020年
3 陈志夫;孙瑞;陈刚;;ultraFluidX在整车气动性能开发中的应用与验证[A];2019Altair技术大会论文集[C];2019年
4 武赟;岳建华;汤煜;;基于MATLAB的地球物理模型并行计算实现与性能分析[A];2019年中国地球科学联合学术年会论文集(二十三)——专题58:深地资源地震波勘探理论、方法进展、专题59:煤炭资源与矿山地球物理 、专题60:智能仪器技术及其在地学探测中的应用[C];2019年
5 陈磊;潘忆江;;基于并行计算的指控系统计算机自主可控技术研究[A];第八届中国指挥控制大会论文集[C];2020年
6 李东东;徐雅南;喻聪;;一种基于MPI并行计算的声呐信号模拟器设计[A];2020'中国西部声学学术交流会论文集[C];2020年
7 王元元;曾建潮;谭瑛;;基于并行计算模型的并行微粒群算法的性能分析[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
8 孙乐;何颖波;吴瑞安;石正军;李于峰;;面向对象有限元并行计算框架的多场耦合服务[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
9 裘懿勇;徐斌;刘晓明;;并行计算作业调度系统的架构及应用[A];第十四届中国科协年会第5分会场:绿色船舶与海洋装备创新发展及产业化论坛论文集[C];2012年
10 裘懿勇;徐斌;刘晓明;;并行计算作业调度系统的架构及应用[A];2012年MIS/S&A学术交流会议论文集[C];2012年
11 左风丽;莫则尧;叶文华;;计算流体三维分裂格式的高效并行计算[A];中国工程物理研究院科技年报(2003)[C];2003年
12 李刚;;蒙特卡罗区域分解并行计算的伪随机数应用[A];中国工程物理研究院科技年报:2013年版[C];2013年
13 胡金初;;并行计算中的任务分配算法[A];2005年全国理论计算机科学学术年会论文集[C];2005年
14 张理涛;黄廷祝;谷同祥;左宪禹;;一种适合于分布式并行计算改进的平方共轭残差法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
15 王晓彤;王希敏;;波束形成多核并行计算加速比分析[A];中国声学学会水声学分会2015年学术会议论文集[C];2015年
16 李利杰;雷咏梅;;一种面向网格的二级并行计算模型研究与实现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
17 唐维军;张景琳;蔚喜军;;三维流体界面不稳定性的并行计算[A];中国工程物理研究院科技年报(2000)[C];2000年
18 张亚林;石正军;黄清南;李丽娟;;纯几何光线追迹的数值并行计算[A];中国工程物理研究院科技年报(2003)[C];2003年
19 陈婧韵;李波;陈蒋科;李媛;;基于均衡并行计算模型的充电桩故障智能诊断及准确度评价[A];2019智能电网新技术发展与应用研讨会论文集[C];2019年
20 赫新;何先耀;赵钟;徐庆新;马戎;;CFD高性能并行计算平台HyperFLOW设计与实现[A];中国力学大会-2015论文摘要集[C];2015年
中国博士学位论文全文数据库 前20条
1 张硕;基于FPGA的多路CNN并行计算体系结构研究[D];北京工业大学;2020年
2 王龙晖;基于并行计算的调节阀大数据智能分析及建模方法研究[D];山东大学;2019年
3 贾红学;板的特大增量步算法及并行计算[D];上海交通大学;2015年
4 刘强;基于异构并行计算的流域洪水模拟理论与方法研究[D];西安理工大学;2018年
5 孙安香;数值气象预报变分同化的伴随模式并行计算[D];中国人民解放军国防科学技术大学;2002年
6 龙柏;并行计算平台上的数据索引技术研究[D];中国科学技术大学;2011年
7 管建和;电磁场有限元法解释分布式并行计算的研究[D];中国地质大学(北京);2006年
8 张帆;过程系统优化的分布式并行计算[D];浙江大学;2002年
9 葛芸;基于CNN迁移特征融合与池化的高分辨率遥感图像检索研究[D];南昌大学;2019年
10 苗新强;有限元结构分析多层并行算法研究及应用[D];上海交通大学;2015年
11 万烂军;面向新型异构众核系统的多设备协同并行计算关键技术研究[D];湖南大学;2016年
12 伍湘君;GRAPES高分辨率气象数值预报模式并行计算关键技术研究[D];国防科学技术大学;2011年
13 卢风顺;面向CPU/GPU异构体系结构的并行计算关键技术研究[D];国防科学技术大学;2012年
14 蔡勇;基于GPU的车身结构接触碰撞过程并行计算方法[D];湖南大学;2013年
15 付朝江;集群MPI环境下有限元结构分析并行计算研究[D];上海大学;2006年
16 王之元;并行计算可扩展性分析与优化[D];国防科学技术大学;2011年
17 张禹;基于并行计算的复合生物测定鉴别[D];吉林大学;2006年
18 陈芳跃;CNN符号动力系统[D];上海大学;2004年
19 黄永忠;移动代理计算模型及其在分布并行计算中的应用研究[D];解放军信息工程大学;2007年
20 胡悦;并行计算时间与存储空间关系研究[D];上海大学;2011年
中国硕士学位论文全文数据库 前20条
1 刘金通;基于CPU/MIC异构平台的车身结构有限元分析并行计算方法[D];湖南大学;2019年
2 汪超;薄壳结构的多GPU并行计算方法及其在车身设计中的应用研究[D];湖南大学;2019年
3 李文达;城市暴雨内涝精细化模拟关键技术与方法[D];华北电力大学(北京);2019年
4 罗木兰;并行流线追踪方法及其在盆地地下水模拟中的应用[D];中国地质大学(北京);2019年
5 于涛;基于并行计算的点阵结构双尺度并发优化设计[D];大连理工大学;2019年
6 刘耀;全球热源工厂提取算法的并行化实现[D];北京林业大学;2019年
7 张学磊;基于异构多核架构的动力学蒙特卡洛并行计算研究及应用[D];浙江大学;2019年
8 孙宇;云计算在智能电网任务调度及潮流并行计算的理论与应用研究[D];天津理工大学;2019年
9 牟锐;基于动态邻域扰动学习的人工蜂群聚类算法[D];西安理工大学;2019年
10 刘广西;稀疏线性方程组并行求解的若干研究[D];福建师范大学;2018年
11 殷诗舒;数据并行计算与Meta分析模型在荷斯坦牛产奶性状关联分析中的应用[D];湖南农业大学;2018年
12 刘飞;基于Spark的并行计算的研究[D];西南科技大学;2019年
13 陈航;ELBM算法的并行化研究与实现[D];湖南大学;2015年
14 郭宁波;众核平台结构网格CFD并行计算研究[D];国防科学技术大学;2016年
15 张纪伟;水声阵列宽带自适应波束形成的GPU众核并行计算[D];国防科学技术大学;2017年
16 王一朝;顺序数据同化方法的并行计算研究[D];西北师范大学;2018年
17 王存波;面向并行计算的并发传输系统设计与优化[D];南京邮电大学;2018年
18 金远洋;格子玻尔兹曼方法的众核平台并行计算与优化研究[D];国防科学技术大学;2017年
19 梁洋洋;面向并行计算的仪器内数据管理的研究[D];哈尔滨工业大学;2018年
20 汤涛;概率粗糙集动态并行计算研究及其在Spark平台的应用[D];南昌大学;2018年
中国重要报纸全文数据库 前20条
1 本报记者 刘艳;[N];科技日报;2020年
2 本报记者 赵广立;[N];中国科学报;2020年
3 本报记者 赵广立;[N];中国科学报;2020年
4 本报记者 谷业凯;[N];人民日报;2020年
5 山西 刘国信;[N];电子报;2017年
6 本报记者 孙喜保;[N];工人日报;2017年
7 曙光信息产业有限公司研发中心 温鑫;[N];中国计算机报;2007年
8 中青报·中青网记者 邱晨辉;[N];中国青年报;2020年
9 英特尔 赵军(Jun Zhao);[N];中国计算机报;2009年
10 英特尔并行计算实验室研究员 TimothyMattson;[N];中国计算机报;2007年
11 安世亚太 雷先华;[N];中国航空报;2005年
12 ;[N];人民邮电;2008年
13 ;[N];计算机世界;2000年
14 中青报·中青网记者 邱晨辉;[N];中国青年报;2020年
15 江锡民;[N];新华日报;2009年
16 本报记者 贡晓丽;[N];中国科学报;2017年
17 轶嘉;[N];人民邮电;2009年
18 曙光信息产业有限公司研发中心 温鑫;[N];中国计算机报;2007年
19 陈文光;[N];中国电子报;2008年
20 本报特约记者 胡浩;[N];环球时报;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978


{bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck}| {bck体育下载}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bcksports}| {bck体育下载}| {bckbet}| {bcksports}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bck官网}| {bck体育下载}| {bckbet}| {bcksports}| {bck官网}| {bck体育app}| {bck体育}| {bcksports}| {bck官网}| {bck体育下载}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck体育}| {bcksports}| {bck官网}| {bck体育官网}| {bck体育下载}| {bck体育}| {bckbet}| {bcksports}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bck官网}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bcksports}| {bck官网}| {bck}| {bck体育官网}| {bcksports}| {bck体育下载}| {bck体育app}| {bckbet}|
{uc8}| {uc8体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐城}| {uc8彩票}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {uc8体育}| {UC体育}| {uc8老虎机}| {uc8老虎机}| {UC8娱乐}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8老虎机}| {uc8彩票}| {uc8}| {uc8体育}| {UC体育}| {uc8官网}| {UC8娱乐}| {UC8娱乐城}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {UC8娱乐城}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {UC8娱乐城}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {uc8彩票}| {uc8}| {uc体育}| {UC体育}| {UC8娱乐城}| {uc8}| {UC体育}| {uc8官网}| {uc8老虎机}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {UC8娱乐城}|