收藏 分享(赏)

美国当代英语语料库(COCA)使用介绍.ppt

上传人:weiwoduzun 文档编号:3534973 上传时间:2018-11-12 格式:PPT 页数:56 大小:1.97MB
下载 相关 举报
美国当代英语语料库(COCA)使用介绍.ppt_第1页
第1页 / 共56页
美国当代英语语料库(COCA)使用介绍.ppt_第2页
第2页 / 共56页
美国当代英语语料库(COCA)使用介绍.ppt_第3页
第3页 / 共56页
美国当代英语语料库(COCA)使用介绍.ppt_第4页
第4页 / 共56页
美国当代英语语料库(COCA)使用介绍.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

1、美国当代英语语料库(COCA)使用说明,http:/corpus.byu.edu/coca,一、COCA语料库简介,COCA简介 COCA:美国当代英语语料库(Corpus of Contemporary American English)是由美国杨伯翰大学(Brigham Young University)的Mark Davies 教授开发的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。,COCA语料库简介,COCA美国当代英语语料库涵盖美国这一时期的口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊(acade

2、mic)五大类型的语料库,并且在这五个类型方面基本呈均匀平衡分布。 网址:http:/corpus.byu.edu/coca,COCA简介,选择学习COCA的原因,1. COCA免费且在线方便。 2. 规模大(4.5亿,1990-2012)、速度快(一般几秒)、词性标注易于理解。 3.时效性强每年至少更新两次,并且每年新增2000万词汇。,COCA界面简介,主要包括三大功能区: 显示及查询条件界定区,包括:显示方式区,字串查询区,语料库分类区,查询结果排列方式区。 查询结果数据显示区 例句显示区,COCA界面简介,COCA界面简介,显示方式区: 1.LIST列表显示 2.CHART图表显示,可

3、以显示在各语料库类型中的使用频率和各时间段内的使用情况。 3.KWICKey word in context,上下文关键词显示 4.COMPARE单词比较显示,比较两个不同词或短语的搭配情况。,COCA界面简介,COCA界面简介,字串查询区: 、WORDS:输入字符串。 、COLLOCATES:上下文限定。 、POS LIST:词性列表,COCA界面简介,COCA界面简介,语料库分类区(五大类型语料库共包括42个子语料库)。 功能:此区可以对查询的字符串限定语料类型(Genre)和时段(Year) ,并且可以明确到查询某一个子语料库,时段也可以查询任何一年的某个字词的使用情况。,COCA界面简

4、介,语料库分类区(五大类型语料库共包括42个子语料库)。,COCA界面简介,语料库分类区(五大类型语料库共包括42个子语料库)。,二、COCA主要搜索功能,2.1 搜索words、phrases、lemmas(单词的所有形式)、wildcards(通配符)和其他更加复杂的字词。 例1. 输入单词“mysterious” (图2.1.1-1):得到相关结果(图2.1.1-2):在各子库中的频率,每百万词使用的频率。 若对图2中的相应条块进行点击,那么就可以看到KWIC,如图2.1.1-3 (以点Fiction的条块为例):,图2.1.1-1,图2.1.1-2,使用CHART显示,图2.1.1-3

5、,例句显示区使用的是KWIC显示,KWIC显示方式,蓝色名词 紫色动词 绿色形容词 棕色副词 灰色代词 黄色介词,KWIC显示方式,COCA主要搜索功能,例2. 输入词组“white+名词” (图2.1.2-1),得到的结果都是white后面跟的名词短语 (图2.1.2-2),检索表达式为:white n*。,图2.1.2-1,图2.1.2-2,White+名词的短语,规则:输入名词的话用正表达式: nn*;动词: v*; 形容词: j*; 副词: r*;代词:p*;连词:c*,POS LIST 词性列表,noun.ALL=名词noun.SG=单数名词noun.PL=复数名词noun.CMN=

6、普通名词noun.+PROP=专有名词noun.-PROP=非专有名词,POS LIST,POS LIST,verb base=动词原形verb.INF=动词不定式verb MODAL=情态动词verb 3SG=动词第三人称单数verb ED=过去式verb EN=过去分词verb ING=现在分词verb.LEX=lexical verb实意动词verb.BE=系动词verb.DO=doverb.HAVE=have,pron.INDF 不定代词pron.PERS 人称代词pron.WH 疑问代词pron.REFL 反身代词adj.CMP 形容词比较级 (comparative)adj.SPR

7、L 形容词最高级 (superlative)adv.particle 副词小品词adv.WH 疑问副词,POS LIST,det.GEN 类指限定词det.POS 物主限定词num.CARD 基数词num.ORD 序数词conj.CRD 并列连词conj.SUB 从属连词Interj. 叹词PUNC 标点,POS LIST,词性列表的使用,1)查询多义词特定的词性 2)某个词前或者后面特定词性的若干搭配词,如confidence前的形容词 3)词性附码放置的位置WORDS或 COLLOCATES处,例3.输入通配符(wildcards),如分别输入un*ly和r?n*,结果如图。,COCA主要

8、功能(一),? 代替一个字母 * 代替任意数量字母,EXAMPLE 3,EXAMPLE 3,例4.输入lemmas(即一个单词的单复数、时态等所有形式),若要得到sing这个单词的所有形式,可以如下图所示。,COCA主要搜索功能,规则:若要得到某个单词的所有单复数和时态形式,那么就要在输入时,在这个单词外加 。,EXAMPLE 4,形容词early的原形,比较级和最高级三种形式一次性检索出来检索,EXAMPLE 4,例5.输入某种词性且部分带有某些字母的命令,如要得到以un-开头、-ed结尾的所有形容词的所有形式(见图2.1.5-1)和得到动词+任何词+ground的所有词组(见图2.1.5-

9、2):,规则:若要得到某种词性且词中带有部分带有某些字母的形式时,如要得到以un-开头、-ed结尾的所有形容词的所有形式,那么输入: un*ed.j*;若要得到动词+任何词+ground的所有词组,那么输入: v*ground即可。前者用来研究词汇,后者用来查询特定词性的搭配。,COCA主要功能(一),图2.1.5-1,图2.1.5-2,动词+任何词+ground的所有词组,2.2 搜索搭配词和出现的频率 如“thick后跟的名词” (图2.2-1),COCA主要搜索功能(二),图2.2-1,规则:在collocates里输入n* 后选择4,表示在thick4后面(4跨距范围内)出现的任何名词

10、,如:跟在 “smile前面的形容词” (图2.2-2),规则:在words里输入: smile.n*,表示作为名词的smile; 在collocates里输入: aj*表示其前后出现形容词的语境。,COCA主要功能(二),Confidence前使用的形容词 图2.2-3,2.3 搜索在子语料库内(或之间)出现的频率(或比较)(不同语域中的用法) 如在Fiction和Newspaper子语料库中passionate后面可以跟任何名词的词及频率,分别如两图(2.3-1和2.3-2)。,COCA主要功能(三),图2.3-1,图2.3-2,但是也可以之间对两者子语料库中它们出现频率的对比,操作:分别

11、选择section 1&2,如下图(图2.3-3):,COCA主要功能(三),2.4 进行语义倾向比较 2.4.1 比较近义词 如:近义形容词hot和warm后面所跟名词的区别(如图2.4.1):,COCA主要功能(四),图2.4.1,规则:在words的方格里分别输入hot和warm,再在collocates方框里输入nn*,表示后面所跟任何名词。当然也可以比较在某个子语料库中出现的频率比较。,2.4.2 比较反义词 如:woman和man前面所跟的形容词的区别(如图2.4.2),图2.4.2,规则:在words的方格里分别输入woman和man,再在collocates方框里输入j*,选在

12、左3,表示前面3个跨距内所有的形容词。当然也可以比较在某个子语料库中出现的频率比较。,2.4.3 搜索近义词 如:搜索beautiful的所有近义词(如图2.4.3-1),规则:在words的方格里输入=beautiful,表示和beautiful语义相近的所有形容词。,再如:搜索动词clean的所有近义词,如下图:,图2.4.3-2,Question,Application和increase能否作主谓搭配?,查询结果,筛选出“应用”和“增加”作主谓搭配的例句,The annual application of fertilizers has increased by 5.48% on ave

13、rage since 1980, and that of pesticide In ten Member States, average application of nitrogen increased almost 400% between 1950 and 1981. Finally, studies have shown that application of biosolids increases the water holding capacity as well as reduces the potential of the.,结论,Application可以和 increase作主谓搭配,但多用于学术期刊中,口语中出现很少。,THANK YOU!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 外语学习 > 英语学习

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报