基于大规模网络日志的模板提取研究

作者：崔元; 张琢切词提取模板统计聚类标签识别树在线聚类

摘要：针对直接从大型网络日志中提取网络事件困难的问题,提出了基于大规模网络日志的模板提取方法。该方法可将海量的、原始的网络日志主动转换为日志模板,从而为了解网络事件的根因和预防网络故障的发生提供重要的前期准备。首先分析日志的结构,将日志中的词划分为模板词和参数词两类;然后从3个不同的角度切入,分别对日志进行模板提取研究;最后使用互联网公司中的实际生产数据,采用Rand_index方法来评估3种提取方法的准确有效性。结果表明,在从服务集群中收集来的4种不同消息类型中,基于标签识别树模型提取到的日志模板的平均准确率达到99.57%,高于基于统计模板提取模型和基于在线提取模板模型的准确率。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机科学

《计算机科学》（CN：50-1075/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《计算机科学》报导国内外计算机科学与技术的发展动态，以其新颖、准确、及时为特色，突出动态性、综述性、学术性，“前沿学科”与“基础研究”相结合；“优秀技术”与“支撑技术”相结合；“倡导”与“争鸣”相结合。

杂志详情

服务推荐

计算机科学相关期刊

基于大规模网络日志的模板提取研究

服务推荐

在线咨询

杂志订阅

期刊推荐

科技风

魅力中国

科学与财富

科学中国人