HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于隐马尔科夫和主成分分析的电网数据词典构建

作者:秦欢; 门业堃; 于钊; 叶宽; 侯宇程; 孙致...文本分类分词隐马尔可夫技术监督

摘要:电网企业拥有海量采用中文记录的非结构化文本信息,其中包含有大量重要的可靠性统计信息。但依靠人工对其进行挖掘不仅效率低而且准确性因人而异。如何高效、准确、智能地挖掘电网企业设备缺陷文本中重要的可靠性统计信息是目前亟待解决的问题。文章基于改式隐式马尔科夫算法对通过全过程技术监督工作采集的非结构化文本数据进行分句分词,制定研究非结构化数据的结构化表达规则。利用主成分分析、词向量以及深度神经网络等的自然语言处理算法对现有的问题描述文本中的同名词、同义词以及近义词等的语义相似度进行计算,并采用K阶近邻算法对降维后的词向量进行分类聚类。上述工作解决了缺陷文本句子成分难以划分、数字量无法精确提取等问题,形成一份国网系统运检专业领域的数据词典库,为电网领域的非结构化数据挖掘提供了新技术,为今后技术监督工作的展开具有重要意义和贡献。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电力大数据

《电力大数据》(月刊)创刊于1977年,由贵州电网有限责任公司主管,贵州电网有限责任公司电力科学研究院;贵州省电机工程学会主办,CN刊号为:52-1170/TK,自创刊以来,颇受业界和广大读者的关注和好评。 《电力大数据》主要刊登人工智能、大数据分析、云计算、泛在物联网、移动作业、区块链等技术在电力系统的应用研究最新成果,涉及电力设备制造、规划设计、发电、输电、供电、配电、用电、调度、电力市场交易等方面。

杂志详情