作者:郑波; 胡其; 林君语义分析文本应用结构化数据信息挖掘淘宝网技术输入
摘要:淘宝网每天产生千万级的用户输入文本(简称UGC),它们是无结构的,因此与结构化数据相比,更难通过语义分析技术进行信息挖掘。然而,UGC的无结构化,又使得其能够挖掘的信息是无限的。本文将讲述如何利用文本语义分析技术来挖掘有价值的信息,并介绍该技术在淘宝网的应用情况。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《程序员》(CN:11-5038/G2)是一本有较高学术价值的月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
部级期刊
人气 227365 评论 65
省级期刊
人气 210613 评论 71
人气 210223 评论 35
北大期刊、统计源期刊
人气 189852 评论 73