作者:张波; 陈宏朝; 朱新华; 吴田俊词语相似度知网多重继承信息内容描述逻辑
摘要:针对目前中文词语语义相似度方法中基于信息内容的算法研究不足的问题,对知网信息模型上使用基于信息内容的中文词语相似度算法进行了研究。根据知网采用语义表达式表示知识而缺乏完整概念结构的特点,通过抽取知网语义表达式中的抽象概念,结合原知网义原树构建具有多重继承特征的知网义项网作为基于信息内容的计算本体;根据该义项网,对基于信息内容的词语相似度算法进行了改进,提出了新的信息内容含量计算方法。经过Miller&Charles(MC30)基准平台的测试,验证了基于信息内容方法在计算中文语义相似度方面的可行性,也证明了该计算策略和改进算法的合理性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社