HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于LDA模型的网页采集算法设计研究

作者:胡六四lda网页采集动态内容

摘要:根据网页动态内容提出了一种具体采集方法,利用基于关联的LDA(Latent Dirichlet Allocation)算法,设计了一个基于内容的网页动态内容采集算法.本算法能为网页中的动态内容提供自动注释,并且利用了动态内容和文本内容之间的语义关系.基于关联的LDA提供了概念级匹配,来建立文本和网页动态内容之间的对应关系,以达到更高检索精确度.实验结果表明,与基于SVM方法相比,本算法具有较高的精确度和召回率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

大庆师范学院学报

《大庆师范学院学报》(双月刊)创刊于1981年,由黑龙江省教育厅主管,大庆师范学院主办,CN刊号为:23-1375/G4,自创刊以来,颇受业界和广大读者的关注和好评。 《大庆师范学院学报》第1、2、4、5期刊发哲学社会科学论文,第3、6期刊发自然科学研究论文。以邓小平理论和“三个代表”重要思想为指导,坚持理论联系实际,关注科学发展,反映各学科研究的前沿和热点,研究和探讨在建设中国特色社会主义实践中提出的各种理论问题,本刊坚持思想性与学术性的统一,理论性与实践性的统一,创新性与科学性的统一,倡导求实严谨的治学风气,为...

杂志详情