作者:沈静中文分词汉字短串串频统计
摘要:中文分词是中文文本挖掘的重要环节。中文分词的方法主要有基于辞典与规则和基于统计两种,“基于串频统计和词形匹配的分词系统”在一定程度上结合了中文分词两种方法的优点于一体.它充分利用文本本身的信息建立临时辞典,再配合一定的常用辞典,用词形匹配的方法达到分词的目的。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《中国高新科技》(CN:10-1507/N)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《中国高新科技》系CNKI中国期刊全文数据库(中国知网)、万方数据库、中国优秀期刊(遴选)数据库、中国学术期刊综合评价数据库、中文科技期刊数据库、龙源期刊网等全文收录期刊。
北大期刊、统计源期刊
人气 542299 评论 58
部级期刊
人气 330723 评论 48
人气 288573 评论 60
省级期刊
人气 253861 评论 55