HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种Spark下分布式DBN并行加速策略

作者:黄震; 钱育蓉; 于炯; 英昌甜; 赵京霞分布内存计算框架缓存替换范围分区深度信念网络数据倾斜

摘要:Spark下分布式深度信念网络(Distributed Deep Belief Network,DDBN)存在数据倾斜、缺乏细粒度数据置换、无法自动缓存重用度高的数据等问题,导致了DDBN计算复杂高、运行时效性低的缺陷.为了提高DDBN的时效性,提出一种Spark下DDBN数据并行加速策略,其中包含基于标签集的范围分区(Label Set based on Range Partition,LSRP)算法和基于权重的缓存替换(Cache Replacement based on Weight,CRW)算法.通过LSRP算法解决数据倾斜问题,采用CRW算法解决RDD(Resilient Distributed Datasets)重复利用以及缓存数据过多造成内存空间不足问题.结果表明:与传统DBN相比,DDBN训练速度提高约2.3倍,通过LSRP和CRW大幅提高了DDBN分布式并行度.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

微电子学与计算机

《微电子学与计算机》(CN:61-1123/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《微电子学与计算机》是中国计算机学会会刊,本刊的宗旨是,严谨认真,求实创新;以人为本,研以致用;弘扬科学,追求真理。本刊国内公开发行,面向科研院所,厂矿技术人员、院校师生和管理人员,及时提供国内微电子与计算机行业最新科研成果。

杂志详情