HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

Web新闻正文信息抽取技术研究

作者:彭同坠中文信息处理包装器新闻页面信息抽取

摘要:信息抽取技术的研究旨在为人们提供一种更有利的获取信息的方式,针对互联网上web页面的异构性和动态性,本文提出了一种通用的web新闻页面信息抽取的方法。该方法克服了传统的网页信息抽取中针对不同的网站制作不同的包装器的缺点。本方法主要针对新闻页面正文、时间、转载情况的信息抽取,为自然语言处理的研究提供语料支持,其准确性能够很好地满足需求。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

科教文汇

《科教文汇》(CN:34-1274/G)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《科教文汇》遵循"严谨、唯实、公开、优质"的方针,力求体现"现代"、"实用"、"综合"三大特色。其主要任务是宣传党和国家有关科技、教育、文化事业发展的态势、全面提高科教文工作者的素质,从而推动我国科教文化事业的发展。

杂志详情