语料库语言学

2020, v.7(02) 70-82

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

汉语学术口语语料库的创建与应用研究
The construction and application of The Academic Spoken Chinese Corpus

韩毅;刘运同;

摘要(Abstract):

在汉语国际教育的理论研究和教学实践中,汉语学术口语是一个重要的组成部分,然而目前该领域的研究和探索十分有限。本文使用LancsBox平台搭建了规模达86,395字的试验性汉语学术口语语料库。在语料采写的过程中,通过运用语音识别技术,再结合文本人工校对,大幅提高了采写的工作效率。语料处理方面,在参考各类标注系统的基础上,研究采用XML格式,标注了停顿、重复、口误、填充词、未完句和替换等口语现象。同时,利用所搭建的汉语学术口语语料库,本文对汉语学术口语的一些典型特征开展了初步研究。在词频统计和词语分布分析的基础上,本文还完成了汉语学术口语中的自然停顿单位分析及其分布统计,发现自然停顿单位的长度集中在1—15个音节的区间上。

关键词(KeyWords): 汉语学术口语;语料库创建;汉语国际教育

Abstract:

Keywords:

基金项目(Foundation):

作者(Author): 韩毅;刘运同;

Email:

DOI:

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享