作者:黄颖; 李伟文本挖掘背景知识关联规则挖掘新颖度网站
摘要:提出了基于用户的文本挖掘的框架,然后用一个例子阐述了从竞争者网站进行知识发现,这里用关联规则发现知识,用户的背景知识用概念层的方式从个人网站中获取,概念层从背景文档中抓取词的语义以及词间的相互关系,从竞争者网站的文档中获取名词性短语,从而识别关联规则.兴趣度度量(如新颖度)用来度量先行词和某一背景知识规则结果间的语义距离,用户评估发现规则的新颖度,显示了算法和人的判断的相互关系可以与人的判断相媲美.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社