清华大学软件工具半结构化非结构化实时处理数据类型副院长
摘要:清华大学新闻与传播学院教授、副院长陈昌凤在2013年第1期《新闻与写作》刊文,介绍了“大数据”对于媒体的价值。“大数据”是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,其主要特点是海量、非结构化和半结构化、实时处理,业界将其归纳为4个“V”:Volume(数据量大),Variety(数据类型多样),Velocity(处理速度快),Value(价值密度低)。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社