作者:胡俊; 摆亮; 吕志泉钓鱼检测深度学习自编码轻检测
摘要:提出一种基于深度学习的层次化钓鱼网站检测方法,方法包括两大部分,第一部分叫“轻检测”,主要对千万级的输入进行快速预判断,得出最为疑似的钓鱼网站列表,从而将原始输入规模降低到一定的数量级规模。轻检测轻便、快速、尽量准确,并达到了最少数量的漏报,从而发挥对巨大输入进行预处理和数据筛选的作用。完成第一部分的轻检测后,将筛选后的数据源输入到第二部分的重检测中。重检测是一种细粒度检测,这里采用一种基于自编码深度学习的方法,以达到将钓鱼网站从海量网站中分类出来的目的。通过两者的配合,达到系统的平衡,在保证准确性的前提下,提高整个系统的运行效率和处理能力。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社