作者:笪章难; 汪蘅(译); 姜文涛(校)计算文学研究数字人文数据文学阐释自然语言处理词频
摘要:本文以基本统计原则从实证层面讨论计算文学研究中的14篇学术作品,讨论其中所涉及的数据的性质以及导致研究结果的统计工具,指出这其中一系列的技术问题、逻辑谬误和概念缺陷。将所选择的计算文学研究分为两种类型:一种是统计方法严谨,然而并没有提出和解决有意义的学术问题;一种是看似解决了有意义的学术问题,然而或者统计方法并不严谨,或者并没有必要使用统计学和其他机器学习工具。本文通过探讨这些文章所使用的数据以及所使用的计算方法,试图去神秘化计算工具在文学语料库中的应用,重提文学语言修辞和阐释的复杂性,得出的结论是:计算文学批评的方法论和理论前提并不适用于分析文学、文学史和语言学的复杂性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社