作者:张睿敏; 张琪淼; 杜叔强; 贾桂霞大数据spark并行流式化贝叶斯分类
摘要:随着大数据的爆发,如何提高算法的执行效率是大数据分类的研究热点,Spark是分布式并行计算框架,支持迭代数据流,该文对朴素贝叶斯文本分类算法作并行流式化处理,实验证明,并行流式化Bayes分类算法能有效提高大数据分类效率。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《工业仪表与自动化装置》(CN:61-1121/TH)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《工业仪表与自动化装置》及时报道国内外自动化和仪器仪表行业的发展方向及最新技术的应用,包括仪器仪表、过程控制、工控机、通讯、现场总线、系统工程等,是从事自动化工程设计、应用及仪表工业方面的科研、生产、管理、设计、操作人员及有关大专院校师生的良师益友。
杂志详情