作者:张紫玄; 王昊; 朱立平; 邓三鸿风险识别hs编码预测svm算法文本分类机器学习
摘要:【目的】利用HS编码数据中所蕴含的规律,为海关税收风险判断分析提供有效的知识服务。【方法】提出直接以HS编码作为风险判别目标和以HS编码正误作为风险判别目标两种基于机器学习的自动分类方案解决HS编码风险判断问题,针对编码目标的结构、特征的性质、文本的长短等特征构建与方案对应的SVM预测模型并进行相应实验。【结果】对以HS编码作为判别目标和以HS编码正误作为判别目标两种预测海关报关风险方案进行探讨与分析,发现后者对训练数据的要求更低,预测速度更快,风险的识别效果也更好。【局限】仅获得4个月的数据,可能存在样本代表性不足的问题。【结论】最终经过测试获得风险预测率较高的分类器,为形成可实用的分类模型和判别系统提供了良好的知识基础。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社