HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

多语种eml文件编码及语种识别算法研究

作者:张健 任炜 蒋欣 陈辰 赖跃群 袁保社eml编码识别多语种语种识别

摘要:Eml文件是当前流行的邮件正文格式之一,国内国际对汉、英、俄语种的识别和研究技术已比较成熟,但维吾尔语、哈萨克语及阿拉伯语研究还处于起步阶段.本文研究了包含汉、维、哈、阿拉伯、俄、英文六个语种的eml文件编码格式及编码获取算法,尤其是采用维吾尔语、哈萨克语及阿拉伯语书写的的eml由B件,正确解析邮件头信息和正文内容,实现了对eml文件的语种精确识别.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

新疆大学学报·哲学人文社会科学版

《新疆大学学报·哲学人文社会科学版》(CN:65-1034/G4)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。坚持为社会主义服务的政治方向,强调学术性、思想性和创新性,特别注重立足新疆,面向全国,既充分体现本校和新疆的区域特色,又致力于促进学术的交流和繁荣。 《新疆大学学报·哲学人文社会科学版》现已更名为《新疆大学学报·哲学社会科学版》。

杂志详情