HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于串频统计和词形匹配的分词系统

作者:沈静中文分词汉字短串串频统计

摘要:中文分词是中文文本挖掘的重要环节。中文分词的方法主要有基于辞典与规则和基于统计两种,“基于串频统计和词形匹配的分词系统”在一定程度上结合了中文分词两种方法的优点于一体.它充分利用文本本身的信息建立临时辞典,再配合一定的常用辞典,用词形匹配的方法达到分词的目的。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国高新科技

《中国高新科技》(CN:10-1507/N)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《中国高新科技》系CNKI中国期刊全文数据库(中国知网)、万方数据库、中国优秀期刊(遴选)数据库、中国学术期刊综合评价数据库、中文科技期刊数据库、龙源期刊网等全文收录期刊。

杂志详情