语料库语言学

2019, v.6(01) 71-86+116

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

北京大学CCL语料库的研制
The building of the CCL corpus:Its design and implementation

詹卫东;郭锐;常宝宝;谌贻荣;陈龙;

摘要(Abstract):

北京大学中国语言学研究中心CCL语料库是面向语言学本体研究和语言教学的大规模语料库,目前包括现代汉语、古代汉语和汉英句对齐平行语料,规模超过7亿汉字。CCL语料库检索系统以包括汉字、字母、标点等在内的字符为基本索引单位,提供普通查询、批量查询、模式查询等多种检索方式。同时该系统支持限定范围查询、基于复杂检索表达式的查询、统计模式频次、对查询结果进行排序、下载查询结果等功能。本文介绍CCL语料库的建设情况与主要功能,具体涉及语料分布概况、语料库查询功能和使用方式、语料库索引与检索技术架构等。

关键词(KeyWords): 北大CCL语料库;汉英双语对齐语料;语料检索;语料索引

Abstract:

Keywords:

基金项目(Foundation): 2015年度教育部人文社科重点研究基地重大项目(15JJD740002)的支持

作者(Author): 詹卫东;郭锐;常宝宝;谌贻荣;陈龙;

Email:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享