HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于数据结构编码的国民经济行业分类在舆情监测项目中的应用

作者:万音泽国民经济行业分类整数数字编码编码扩展数据结构编码舆情监测

摘要:GB/T 4754-2017《国民经济行业分类》的代码编制方法为基于整数数字顺序编码,在金融工程的舆情监测项目中进行数据挖掘、机器学习时存在编码数量扩展、层级扩展、属性扩展等问题。根据国民经济行业分类的差别化整数数字顺序编码方式,提出一套基于数据结构的分类编码方法,进而提出采用CSV、XML格式文件进行存储和读取,在舆情监测项目中采用C++语言编制针对CSV格式文件的国民经济行业分类编码的读取程序,并形成XML树状结构。采用基于数据结构的编码方式,具有良好的扩展性,可有效实现编码层级扩展、编码数量扩展、编码属性扩展,能广泛用于数据存储、读写、交换,具有较好的通用性,对于些国民经济统计、分类、存储及金融工程的数据挖掘、机器学习等项目具有借鉴意义。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

天津科技

《天津科技》(CN:12-1203/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《天津科技》获奖情况:2007年度刊登3篇获国家科技进步二等奖的文章。天津市一级期刊。欢迎全国企事业单位广大科研人员、科技管理工作者在本刊刊登论文,详情请致电本刊编辑部。

杂志详情