作者:邓耀臣; 冯志伟词长词频计量语言学语言共性
摘要:本文以语料库为基础,以协同语言学理论为指导,对汉语词汇长度与词汇在语篇中的使用频数之间的关系进行计量语言学分析。研究结果表明,词汇的使用频数和词汇长度之间存在明显的依存关系。词汇越长,在语篇中的使用频数越低,二者成反比关系。幂函数模型Y=axb。能够准确地描述汉语词汇的这种规律性特征。研究结果同时表明,模型参数a具有较强的文本语体区分功能。本研究结果不仅完善了词长和词频之间关系的相关理论,为二者之间关系的语言共性提供了新证据,而且为语体识别和文本分类提供了新的方法和思路。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社