语料库语言学

2020, v.7(01) 44-56+114

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

语料库数据性质面面观
Aspects of the nature of corpus data

孙仕光;

摘要(Abstract):

通过对语料库数据进行分析得到可靠的语言知识的前提和基础是全面、深入地了解语料库数据的性质,并选用与数据性质对应的数据分析工具。本文通过梳理一些关于语料库数据的研究,尝试对语料库数据特点作出系统性总结。本文发现:语料库数据很多情况下不服从正态分布,语料库数据具有层级嵌套结构,语料库数据具有一定程度的非平衡性、非随机性、非代表性和非独立性,语料库数据潜在地包含固定效应和随机效应因素。针对这些特质,目前较为恰当的语料库数据统计分析工具有秩和检验、混合效应/层级模型等。

关键词(KeyWords): 语料库数据;数据性质;数据分析

Abstract:

Keywords:

基金项目(Foundation):

作者(Author): 孙仕光;

Email:

DOI:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享