HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于文本分块的多模板隐马尔可夫模型的文本信息抽取

作者:王雷; 陈治平; 李志成文本信息抽取隐马尔可夫模型多模板文本分块

摘要:针对文本信息抽取中训练数据来源的多样化,不利于学习到最优的模型参数的问题。提出了一种基于多模板隐马尔可夫模型的文本信息抽取算法.新算法利用文奉排版格式、分隔符等信息,对文本进行分块,在此基础上。通过对训练数据分成多个形式模板训练隐马尔可夫初始概率及转移概率参数,最后,结舍统一训练的释放概率参数,对文本信息进行抽取.实验结果表明,新算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

山东大学学报·理学版

《山东大学学报·理学版》(CN:37-1389/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《山东大学学报·理学版》为理工科综合性学术期刊。旨在反映该校自然科学领域中的最新研究成果,促进学术交流,活跃学术思想。

杂志详情