HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于句法语义特征的实体关系抽取技术

作者:姚春华; 刘潇; 高弘毅; 鄢秋霞关系指示词词典实体关系抽取语义特征句法依存关系值logistic

摘要:实体关系抽取将非结构化的数据转化为结构化的数据,是自然语言处理任务的重要基础。针对人与人之间的六种关系——父母、子女、夫妻、兄弟妇妹、同事、其他,在人与人之间六种关系语料库缺少的情况,采用百度百科的语料库构建五个类别(父母、子女、夫妻、兄弟姐妹、同事)的关系指示词词典,再根据关系指示词词典来判定实体对关系类型。采用上述方法,结合人工标定扩充五个类别(父母、子女、夫妻、兄弟姐妹、同事)语料库,根据中文的语法特点设计了一系列的特征,包括实体本身的词、词性标注以及实体上下文环境的词、诃阻恃征。另外,融入实体的依存句法关系值、实体与核心谓词距离的特征,并构建二元实体对特征向量,采用logistic进行训练和测试。针对文本中含有多对二元实体对,通过统计文本中关系指示词的个数,使得句子中二元实体对不超过关系指示词的个数。实验结果证明,在人与人的关系识别中,准确率和召回率都可以达到87%。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

通信技术

《通信技术》(CN:51-1167/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《通信技术》是国内创办时间长、影响大的IT专业媒体,主要报道信源处理、传输、业务与系统、网络、移动通信、信息安全等方面的先进技术、理论研究成果和最新动态。

杂志详情