作者:艾赛提江·艾拜都拉url遍历数据采集字体转换html过滤unicode
摘要:随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极有价值的信息源.从而维文网站也逐步增长,但是因为维文字库编码还没有标准化,所以到目前为止还没有一个针对维文网站的比较实用的搜索引擎,这对维吾尔族用户在网上检索信息带来了极大的不便.本文通过讨论维文网上信息处理中的一些关键技术问题,提出了维文网站搜索引擎的URL遍历、数据采集、查询服务三个核心技术模块的解决方案.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社