HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

分布式平台等值连接优化技术分析

作者:陈军等值连接元组过滤数据倾斜shuffle

摘要:等值连接是数据分析中最常用、价值最高的操作之一,既广泛运用于传统关系型数据库的查询中,也是大数据分析处理的重要基础性环节。然而分布式平台由于存在多个节点,存储和计算都是分布式的,一些传统等值连接优化方法在分布式平台中难以实现,或时间代价、内存消耗、网络资源占用巨大。因此针对分布式平台特点,对等值连接问题进行研究十分必要。从分布式平台等值连接中元组过滤、数据倾斜处理两个大的方面对当下的研究技术及其适用场景进行分析,对根据数据的特征选择适合的等值连接优化方案提供参考。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

现代计算机

《现代计算机》(CN:44-1415/TP)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《现代计算机》是一本学科性、技术性较强的科技类学术期刊,作者读者群均面向计算机信息技术及应用研究开发设计生产的工程技术人员、大专院校师生及计算机爱好者。

杂志详情