HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

谷歌含7种语言的全新数据集PAWS和PAWS-X

作者:本刊讯自然语言理解数据集谷歌paws训练数据精度提高释义语言

摘要:近日,谷歌了包含7种语言释义对的全新数据集PAWS与PAWS-X。BERT通过该数据集的训练,在释义对问题上的精度实现了约3倍的提升,其他先进的模型也能够利用该数据集将精度提高到85%-90%。识别一对句子是否为释义对的任务则被称为释义识别,这一任务对于许多实际应用中的自然语言理解而言是非常重要的,例如:常见的问答任务等。但是,目前即使是最先进的模型(如BERT),如果仅在现有的自然语言理解数据集上进行训练,并不能正确地识别大部分非释义对之间的差异。其中很大的原因是由于在现有自然语言理解数据集中,缺少诸如此类的训练数据。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

数据分析与知识发现

《数据分析与知识发现》(CN:10-1478/G2)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《数据分析与知识发现》内容定位于广泛吸纳计算机科学、数据科学、情报科学以及数字科研、数字教育和数字文化等领域的技术与方法,研究数据驱动的语义计算、内容分析、数据挖掘、知识发现、智能管理和决策支持等方面的技术、方法、系统以及支撑设施、政策与机制等,尤其是聚焦从海量、异构、分布、动态、甚至富媒体数据中挖掘和发现知识以支持研究、管理和决...

杂志详情