作者:张云洋藏文编码搜索引擎倒排索引网页爬虫
摘要:通过分析藏文网站中藏文字符的编码特点,结合搜索引擎的特点对藏文网页搜索的关键技术进行了研究。对藏文网页的URL处理技术、限定爬虫、藏文网页倒排索引的建立、网页的检索和结果排序等进行了详细地阐述,提出了较完整的藏文网页搜索方法,对于藏文网页信息的搜索和利用有一定的实用价值。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《计算机时代》(CN:33-1094/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机时代》主要栏目有学术论坛、技术广角、网络天地、信息安全、应用实践、经验技巧、考试园地、市场纵览、企业信息化等,丰富的内容使您能够自由地遨游在电脑信息的海洋里,了解最新趋势,掌握最新技术,领略精彩纷呈的数字生活。
部级期刊
人气 229697 评论 65
人气 213482 评论 35
省级期刊
人气 212260 评论 71
北大期刊、统计源期刊
人气 192677 评论 73