知名中文语料库:
中央研究院近代汉语标记语料 http://www.sinica.edu.tw/Early_Mandarin/ (台湾的繁体,在NLTK中有)
2.中央研究院汉籍电子文献 http://www.sinica.edu.tw/ftms-bin/ftmsw3
- 国家现代汉语语料库 http://124.207.106.21:8080/ 这个没搜索到
4.国家语委现代汉语语料库 http://www.cncorpus.org/index.aspx
5.树图数据库 http://treebank.sinica.edu.tw/
6.语料库语言学在线 corpus4u.org
-
北京大学CCL语料库 http://ccl.pku.edu.cn/corpus.asp
-
北京大学《人民日报》标注语料库 http://www.icl.pku.edu.cn
-
北京语言大学的语料库 http://www.lits.tsinghua.edu.cn/ainlp/source.htm
-
清华大学TH-ACorpus
-
山西大学语料库
-
台湾南岛语典藏
-
香港城市大学LIVAC共时语料库
14.浙江师范大学的历史文献语料库
-
闽南语典藏
-
中科院计算所语料库
-
中文语言资源联盟
-
SKETCHENGINE多语言语料库