HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

汉语文本可读性特征体系构建和效度验证

作者:吴思远; 于东; 江新汉语文本可读性语言特征机器学习效度验证

摘要:本文研究如何利用汉语文本的语言特征对文本的可读性进行分析。首先从汉字、词汇、句法和篇章四个层面出发,构建了一个预测汉语文本可读性的多层面、多维度特征体系,该特征体系包含13个维度共104项指标。然后以12个年级的语文教材语料库为基础,通过建立机器学习模型考察不同层面、不同维度语言特征的预测能力。实验结果显示:汉字、词汇、句法和篇章四个层面中,基于词汇层面特征的模型准确率最高,基于篇章层面特征的模型准确率最低;13个维度中,预测准确率最高的前5个维度依次为汉字熟悉度、汉字多样性、词汇多样性、短语句法结构复杂度和词汇熟悉度。我们还发现,四个层面语言特征对低难度文本的预测能力均最强。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

世界汉语教学

《世界汉语教学》(CN:11-1473/H)是一本有较高学术价值的大型季刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《世界汉语教学》旨在指导汉语作为第二语言的教学实践推动学科理论建设的基本思想,反映跟随汉语教学有关的最新理论研究成果,交流世界各地的汉语教学经验。

杂志详情