HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

汉语真需要词间空格吗*--对汉语分词连写献疑

作者:熊文新汉语分词词间空格分词标准中文信息处理语言规划

摘要:汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存在的困难进行探讨,指出汉语分词在词的定义、群众语感以及分词规范、词表确定及工程应用等方面都存在不确定及不一致等因素。近年汉语自动分词处理不纠缠于词的确切定义,以字组词,针对标注语料和网络上带有丰富结构信息的海量文本,利用机器学习方法对汉语“切分单位”的标注取得了较好的进展。针对基础性的汉语分词规范,从语言规划的政策性、科学性及引导性角度提出建议,最后指出结合语言学指导和数据驱动的机器学习策略,可望为实现汉语自动分词的准确性和适应性提升服务。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

语言科学

《语言科学》(CN:32-1687/G)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 《语言科学》主要刊登语言科学研究领域内有理论意义和应用价值的基础研究、应用基础研究、应用研究的专论,以及基于共时或历时的具体语言事实且有理论深度或独创性见解和在交叉学科、新兴学科领域中有突破性进展的专题研究成果。

杂志详情