HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

中文新词识别研究概述

作者:李淑平新词识别构词模式词内部概率邻接类别

摘要:新词识别是中文信息处理的重要课题,但因新词产生的速度快,语法、语用灵活,词典难以及时收录等问题使新词识别成为了中文信息处理领域的难点和热点问题。新词识别研究的方法主要有规则方法、统计方法以及规则与统计相结合的方法。新词识别的规则主要有新词词性规则和新词构词模式规则。统计方法主要通过计算词的TF/IDF值、词内部概率、词的频次对比、词的临接类别等进行新词识别。最后该文总结了中文新词识别研究中存在的问题,指出未来研究的方向。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

科技资讯

《科技资讯》(半月刊)创刊于2003年,由北京市科学技术研究院主管,北京国际科技服务中心;北京合作创新国际科技服务中心主办,CN刊号为:11-5042/N,自创刊以来,颇受业界和广大读者的关注和好评。 《科技资讯》主要刊登中外新技术、新材料、新设备、新工艺及融投资项目的新资讯,并刊发能反映中外新技术发展动态,新产品开发进展及概述各学科新发展方向的内容。杂志社现向各级政府机关、相关单位、学校等征集学术论文。

杂志详情