作者:王玮; 苏琦; 刘荫; 周伟; 于展鹏; 穆林云储存异构数据mapreduce模型数据搜索系统设计
摘要:针对云储存中充斥的各种各样异构数据带来的数据搜索复杂的问题,采用多核网络处理器技术构建平台内部硬件加速,结合MapReduce模型设计了API应用程序接口。在数据的搜索过程中,利用Sheduler为媒介对chunk Num个数据子模块划拨给操作模块,并在CPU-GPU并行条件下进行MapReduce流程操作,异构数据搜索平台又将工作chunk进行细化以提升数据的搜索能力。利用WC、SM、MM和KM四种负载测试信息对系统平台进行性能测试,结果显示四种信息的不平衡性均随着数据粒度不断上升,其中,MM数组相乘轨迹的非平衡性自4000开始向上攀升,而SM字符串配、WC字数统计和KM迭代聚类的非平衡性分别对应8000、12000和12000粒度级。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社