作者:翟俊海; 齐家兴; 沈矗; 宋丹丹; 王谟瀚; ...大数据机器学习主动学习样例选择开源框架
摘要:在我们以前的工作中,提出了基于MapReduce的大数据主动学习算法。在本文中,将这一算法移植到Spark环境,提出了基于Spark的大数据主动学习算法,并对基于MapReduce和Spark的2种大数据主动学习算法从运行时间、文件数目、同步数目和内存耗费4个方面进行了比较研究,得出了一些有价值的结论,这些结论将为相关研究人员提供很好的帮助。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社