HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于主题标签和CRF的中文微博命名实体识别

作者:朱颢东; 杨立志; 丁温雪; 冯嘉美命名实体中文微博主题标签条件随机场

摘要:近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields,CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

华中师范大学学报·自然科学版

《华中师范大学学报·自然科学版》(CN:42-1178/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《华中师范大学学报·自然科学版》执行和贯彻国家有关新闻出版方针政策,坚持真理,倡导创新,反对弄虚作假;服务学校教学科研,培养学术新人。经过60年的发展,本刊已成为我校对外学术交流、宣传我校最新教学科研成果的一个重要窗口;同时也是自然科学研究领域一个受人关注的学术阵地,为国内外学者展示自己学术成果提供了良好的平台。

杂志详情