HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于最大熵的泰语句子级实体从属关系抽取

作者:王红斌; 李金绘; 沈强; 线岩团; 毛存礼实体关系实体从属关系抽取汉泰双语平行句对最大熵模型特征模板

摘要:采用基于最大熵模型的方法对泰语句子级实体从属关系的抽取方法进行了研究.针对泰语句子中实体关系抽取的研究进程中语料库较为匮乏的问题,首先使用汉泰双语平行句对作为中间桥梁,将中文研究领域中相对成熟的分词、词性标注和实体识别等成果,通过汉泰双语词典映射到与中文句子相对齐的泰语句子上,对泰语句子进行必要的数据处理操作,并进行一定量的人工校正和人工实体关系标注工作;进而构建基础的泰语实体关系训练语料库.在语料库的基础上,将泰语实体关系抽取问题转化为分类问题,同时结合泰语语言本身的特点,选取合适的上下文特征模板,使用最大熵模型算法对训练语料进行学习训练,构建分类器,对泰语句子中的候选实体关系三元组进行识别,最终达到实体间从属关系自动抽取的目的.实验结果显示该方法可使F值相对于已有的泰语实体关系抽取研究方法提升8%左右.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

南京大学学报·自然科学

《南京大学学报·自然科学》(CN:32-1169/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《南京大学学报·自然科学》报道内容包括数学、天文、计算机科学、物理、信息物理、化学、生物、生物化学、地球科学、大地海洋学、大气科学、环境科学、医学等学科的基础研究和应用研究。

杂志详情