作者:张清军; 朱才连; 侯林山lbs信息抽取模式匹配页面转换
摘要:由于LBS系统的终端设备处理能力较低,显示屏幕较小,再加上无线数据网络带宽不足,因此无法浏览整个Web网页.采用信息抽取技术可以将用户感兴趣的信息提取出来,再发送给用户终端,有效地解决上述问题,信息抽取技术将是LBS系统中的一项重要应用.提出了一种基于信息抽取的从HTML到WML的页面转换方法,首先标记少量的Web网页形成样本实例集,采用归纳算法生成信息抽取规则;其次应用抽取规则和模式匹配来处理结构和风格类似的Web页面;最后将抽取结果转换为WML页面.开发了原型系统,通过对实际数据源的抽取,验证了此方法的有效性.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社