通过对语料库领域相关期刊的分布情况进行西元红河棋牌正版
,有利于了解该领域发文期刊的空间分布,并发现该领域的主流期刊及发展动态;同时,也有助于相关学者了解该领域的西元红河棋牌正版
进展及发文情况。2005-2017年刊出语料库的5 096篇文章分布在251个来源出版物,利用BICOMB 软件对发文期刊进行统计筛选,根据布拉德福定律确定语料库西元红河棋牌正版
文献的核心期刊。将全部文献划分为经典的3个区间,对各个区间的文献数和期刊数进行统计得到区域西元红河棋牌
表,如表1所示:
区域 | 期刊数(种) | 占期刊总数比例(%) | 载文量(篇) | 占论文总数比例(%) | 平均载文密度(篇/种) | 布拉福德常数(n) |
核心区 | 19 | 7.57 | 1 731 | 33.97 | 91.11 | |
相关区 | 44 | 17.53 | 1 670 | 32.77 | 37.95 | 2.315 |
外围区 | 188 | 74.90 | 1 695 | 33.26 | 9.0 | 2.07 |
合计 | 251 | 100 | 5 096 | 100 | 20.30 | |
按照布拉德福定律,以论文为统计单元,将所有期刊按相关论文数降序排列并划分为论文总数大致相等的3个区域,统计各区域的期刊数,判断是否符合1∶n∶n
2。此处,1∶n∶n
2可以作为判断分布是否符合布拉德福定律的评估指标;比例越是接近1∶n∶n
2,则布拉德福定律越显著,布布拉德福定律的应用也越准确
[11]。表2中语料库3 个区域的期刊数为19∶44∶188,即 1∶2.315∶4.27(2.07
2),比例系数基本一致,原始数据能较好地满足布拉德福定律描述的条件。根据“核心区-相关区-外围区”的划分理论,得到19种核心期刊,如表2所示:
序号 | 来源期刊 | 发文量(篇) | 百分比(%) | 累计百分比(%) |
1 | JOURNAL OF PRAGMATICS (语用学期刊) | 295 | 5.788 9 | 5.788 9 |
2 | INTERNATIONAL JOURNAL OF CORPUS LINGUISTICS (语料库语言学国际期刊) | 156 | 3.061 2 | 8.850 1 |
3 | ENGLISH FOR SPECIFIC PURPOSES (专门用途英语) | 114 | 2.237 0 | 11.087 1 |
4 | CORPUS LINGUISTICS AND LINGUISTIC THEORY (语料库语言学和语言学理论) | 96 | 1.883 8 | 12.971 0 |
5 | META (META: 译者期刊) | 84 | 1.648 4 | 14.619 3 |
6 | ENGLISH LANGUAGE & LINGUISTICS (英语语言和语言学) | 83 | 1.628 7 | 16.248 0 |
7 | JOURNAL OF ENGLISH FOR ACADEMIC PURPOSES (学术英语期刊) | 82 | 1.609 1 | 17.857 1 |
8 | COMPUTATIONAL LINGUISTICS (计算语言学) | 81 | 1.589 5 | 19.446 6 |
9 | NATURAL LANGUAGE ENGINEERING (自然语言工程) | 79 | 1.550 2 | 20.996 9 |
10 | REVISTA SIGNOS (符号学期刊) | 78 | 1.530 6 | 22.527 5 |
11 | TEXT & TALK (文本和谈话) | 75 | 1.471 7 | 23.999 2 |
12 | LEXIKOS (词典学) | 72 | 1.412 9 | 25.412 1 |
13 | LINGUISTICS (语言学) | 70 | 1.373 6 | 26.785 7 |
14 | LANGUAGE SCIENCES (语言科学) | 65 | 1.275 5 | 28.061 2 |
15 | IBERICA (伊比利亚) | 63 | 1.236 3 | 29.297 5 |
16 | COGNITIVE LINGUISTICS (认知语言学) | 61 | 1.197 0 | 30.494 5 |
17 | LITERARY AND LINGUISTIC COMPUTING (文学与语言计算) | 59 | 1.157 8 | 31.652 3 |
18 | LINGUA (LINGUA:普通语言学国际评论) | 59 | 1.157 8 | 32.810 0 |
19 | LANGUE FRANCAISE (法语) | 59 | 1.157 8 | 33.967 8 |
期刊共被引(Cited Journal)西元红河棋牌
是指两本或多本期刊被同一篇文献引用的现象,期刊共被引所反映的是各类期刊及学科的关联性,通过期刊共被引西元红河棋牌
可以获得某个西元红河棋牌正版
领域的玉溪西元棋牌
基础分布。采用CiteSpace软件对上述转化后的数据进行期刊共被引西元红河棋牌
。时间分段(Time Slicing)选择2005-2017年,时间切片(Years per lice)选择1,节点类型(Node Types)选择被引期刊(Cited Journal),切片上限(Top N per slice)选择50,运用软件进行可视化西元红河棋牌
结果如图2所示,图中节点较大的期刊是在国际语料库西元红河棋牌正版
领域具有较高影响力的期刊。按照中心度(取中心度前30位的期刊)排序统计,语料库西元红河棋牌正版
的重要被引期刊见表3。
中心度 | 被引期刊 | 被引频次 | 中心度 | 被引期刊 | 被引频次 |
0.46 | LANGUAGE | 1 283 | 0.07 | INTRO FUNCTIONAL GRA | 295 |
0.39 | INT J CORPUS LINGUIS | 698 | 0.07 | LANG SPEECH | 174 |
0.34 | J PRAGMATICS | 1 134 | 0.06 | COMPREHENSIVE GRAMMA | 380 |
0.32 | LONGMAN GRAMMAR SPOK | 509 | 0.06 | J LINGUIST | 371 |
0.31 | COGN LINGUIST | 485 | 0.06 | PRAGMATICS | 234 |
0.21 | APPL LINGUIST | 825 | 0.06 | COMPUTATIONAL LINGUISTICS | 171 |
0.21 | COGNITION | 426 | 0.06 | INT J LEXICOGR | 83 |
0.2 | J MEM LANG | 417 | 0.06 | WOMEN FIRE DANGEROUS | 76 |
0.2 | TEXT | 399 | 0.05 | TESOL QUART | 452 |
0.1 | LANG VAR CHANGE | 365 | 0.05 | J ENGL LINGUIST | 254 |
0.1 | CAMBRIDGE GRAMMAR EN | 265 | 0.05 | LANG COGNITIVE PROC | 164 |
0.1 | COGNITIVE SCI | 248 | 0.05 | DISCOURSE PROCESS | 161 |
0.08 | ENGL LANG LINGUIST | 236 | 0.05 | SPEAKING INTENTION A | 12 |
0.07 | ENGL SPECIF PURP | 532 | 0.04 | CORPUS CONCORDANCE C | 194 |
0.07 | LINGUIST INQ | 359 | 0.04 | J PHONETICS | 37 |
通过CiteSpace得到节点数124,连线数315的期刊共被引图谱(见图2)。被引期刊中心度排名前30的期刊见表3。19种核心期刊见表2。这些期刊发表的语料库语言学成果最多,影响力最大,应该重点关注。19种核心期刊中英国出版5种,荷兰4种,德国4种,法国、西班牙、美国、加拿大、智利、南非各1种;语料库语言学刊物2种,计算机语言学3种,专门用途语言3种,词典编撰1种,翻译1种,语言学4种,认知语言学1种,语用学2种,其他2种。发文量最大的前5种期刊分别是《语用学期刊》《语料库语言学国际期刊》《专门用途英语》《语料库语言学和语言学理论》和《META:译者期刊》,其中前两本期刊的中心度即影响力也是最高的。从核心期刊与期刊共被引情况可以看到,除自语料库西元红河棋牌正版
发端就与其密切相连的词典编撰、翻译、语法描述等领域外,语用学、专门用途英语、认知语言学也广泛地和语料库语言学产生联系,拓展了西元红河棋牌正版
深度和广度。美国语言学协会的刊物《语言》和德国德古意特出版社出版《认知语言学》发表的论文数量不是最多的,但被引中心度分别为第一和第五,也是语料库语言学的重要参考文献,并且证明了认知语言学和语料库的结合是一个新的西元红河棋牌正版
热点。
2.3
西元红河棋牌正版
主体西元红河棋牌
西元红河棋牌正版
主体指从事语料库西元红河棋牌正版
的学者,本文从高产第一作者、高被引作者和作者合作三方面西元红河棋牌
西元红河棋牌正版
主体。
2.3.1
高产第一作者西元红河棋牌
学术影响的广度和深度主要取决于学者所发表的西元红河棋牌正版
成果,通过确定某领域西元红河棋牌正版
的核心作者,可以大致发现该领域的玉溪西元棋牌
地图,从而促进这一领域的学术交流与合作。通过BICOMB2.0 软件对文献发文作者情况统计西元红河棋牌
,5 096篇文献共涉及第一作者3 755人。根据洛特卡定律,当发文量为1篇的作者数占作者总数的比例低于60% 时,会形成核心作者群
[12]。经统计,2005-2017年发文量为1篇的作者有2 968位,约占作者总数的79.04%,高于洛特卡定律提出的60% 标准,说明国际语料库领域未能够形成核心作者群。根据普赖斯定律M=0.749(Nmax)1/2
[13],发文量大于等于3的作者为高产第一作者,共296人,本文统计发文量为6篇及以上的作者,具体如表4所示:
表4
2005-2017年语料库西元红河棋牌正版
部分作者统计 序号 | 作者 | 发文量(篇) | 序号 | 作者 | 发文量(篇) |
1 | S. T. Gries | 16 | 19 | I. M. P Martinez | 6 |
2 | G. M. de Schryver | 12 | 20 | S. Wulff | 6 |
3 | K. Hyland | 11 | 21 | J. Flowerdew | 6 |
4 | G. Parodi | 10 | 22 | R. Venegas | 6 |
5 | D. Biber | 10 | 23 | J. Parkinson | 6 |
6 | D. L. Liu | 9 | 24 | L. Flowerdew | 6 |
7 | P. Collins | 9 | 25 | E. Taljard | 6 |
8 | J. L. B. Arroyo | 9 | 26 | M. Charles | 6 |
9 | M. A. Jimenez-Crespo | 8 | 27 | P. Durrant | 6 |
10 | D. J. Prinsloo | 8 | 28 | S. F. Chung | 6 |
11 | N. C. Ellis | 8 | 29 | L. De Cuypere | 6 |
12 | S. A. Crossley | 8 | 30 | K. O′Halloran | 6 |
13 | P. Baker | 7 | 31 | L. Anderwald | 6 |
14 | M. Hilpert | 7 | 32 | A. Adel | 6 |
15 | A. Partington | 7 | 33 | C. Y. Lin | 6 |
16 | R. Moon | 7 | 34 | J. Owens | 6 |
17 | S.Crossley | 6 | 35 | M. Bednarek | 6 |
18 | C. Ruhlemann | 6 | | | |
表4显示,国际从事语料库西元红河棋牌正版
的主要学者有S. T. Gries、G. M. de Schryver、K. Hyland、G. Parodi和D. Biber等人,这几位高产第一作者发表了10篇以上的高质量论文,他们是国际语料库西元红河棋牌正版
的领军人物。以S. T. Gries等为代表的核心作者总计发文1 146 篇,约占论文总数的22.5%,虽未达到普赖斯提出的50%标准
[14],但贡献比较可观。这一方面说明这些核心作者是语料库西元红河棋牌正版
领域的主体,为语料库的发展做出了重要贡献;另一方面还说明语料库西元红河棋牌正版
的学者群学术影响力还不够大,致使核心作者群尚未形成。
为了进一步了解第一作者之间的合作情况,利用Citespace对收集的文献进行作者合作西元红河棋牌
,得到图3所示的作者合作聚类图谱,图中节点代表被引作者, 节点越大表示作者的发文量越大。
图3
语料库西元红河棋牌正版
领域作者玉溪西元棋牌
图谱 图3中共有377个节点,102条连线,网络密度为0.001 4。其中,节点的大小与作者发文数量有关,节点间的连线表示作者间的合作关系。从图3可知,国际语料库领域形成了以S. T. Gries、G. M. de Schryver和K. Hyland等为代表的高发文作者群,这些作者是国际语料库领域的开拓者和集大成者。
下面仅对发文量前3位高产作者进行简要西元红河棋牌
:S. T. Gries在语料库西元红河棋牌正版
中累计发表英文论文16篇,居于首位。该学者是美国加利福尼亚大学语言学教授、定量语料库语言学家,同时还是一个以认知为导向的使用型语言学家,使用各种不同的统计方法来西元红河棋牌正版
语言的话题,比如使用语料库来西元红河棋牌正版
其主体的同质性与比较、联结与分散测量、N-gram识别与探索以及其他定量方法。G. M. de Schryver发表英文论文12篇,居于第二位,是比利时根特大学语言和文化系非洲语言学西元红河棋牌正版
教授,主要西元红河棋牌正版
语料库语言学、计算语言学,他和D. Joffe一起搭建了20个非洲语言语料库。K. Hyland发表英文论文11篇,居于第三位,是英国东安格利亚大学教授,香港大学应用语言学首席教授、应用英语西元红河棋牌正版
中心主任,国际著名应用语言学家,学术写作与语料库西元红河棋牌
领域世界领军学者。
2.3.2
高被引作者西元红河棋牌
被引频次是衡量西元红河棋牌正版
成果价值的重要指标,被引频次的高低可以反映出作者在相关领域的影响力,对语料库西元红河棋牌正版
期刊的高被引作者进行西元红河棋牌
,可以发现影响语料库西元红河棋牌正版
的重要人物。通过BICOMB2.0软件对高被引作者进行统计西元红河棋牌
发现,143 400篇被引文献共涉及作者85 996人,以被引频次100为节点,得到高被引作者共43 人,具体情况如表5所示:
表5
2005-2017年语料库西元红河棋牌正版
高被引作者统计 序号 | 被引作者 | 被引次数 | 中心度 | 序号 | 被引作者 | 被引次数 | 中心度 |
1 | D. Biber | 925 | 0.39 | 23 | P. J. Hopper | 201 | 0.01 |
2 | M. A. K. Halliday | 582 | 0.16 | 24 | M. Davies | 201 | 0 |
3 | J. Sinclair | 454 | 0.09 | 25 | W. Chafe | 196 | 0.12 |
4 | R. Quirk | 438 | 0.1 | 26 | E. A. Schegloff | 188 | 0.03 |
5 | K. Hyland | 418 | 0.23 | 27 | B. Macwhinney | 182 | 0.02 |
6 | W. Labov | 373 | 0.13 | 28 | K. Aijmer | 173 | 0.05 |
7 | M. Scott | 371 | 0.05 | 29 | J. L. Bybee | 165 | 0.02 |
8 | G. Leech | 359 | 0.05 | 30 | E. Goffman | 160 | 0.06 |
9 | G. Lakoff | 358 | 0.06 | 31 | D. Bolinger | 152 | 0.09 |
10 | R. W. Langacker | 337 | 0.1 | 32 | R. D. Huddleston | 151 | 0.08 |
11 | J. Bybee | 330 | 0.2 | 33 | T. Mcenery | 144 | 0.08 |
12 | S. Hunston | 289 | 0.11 | 34 | M. Baker | 139 | 0.03 |
13 | J. M. Swales | 281 | 0.06 | 35 | S. C. Levinson | 133 | 0.01 |
14 | P. Brown | 264 | 0.04 | 36 | D. Crystal | 132 | 0.01 |
15 | W. Croft | 250 | 0.03 | 37 | H. H. Clark | 126 | 0.05 |
16 | E. C. Traugott | 231 | 0.15 | 38 | H. Sacks | 123 | 0.04 |
17 | A. Goldberg | 230 | 0.09 | 39 | N. C. Ellis | 117 | 0.12 |
18 | N. Chomsky | 221 | 0.01 | 40 | N. Fairclough | 114 | 0.03 |
29 | T. Givon | 217 | 0.03 | 41 | M. Haspelmath | 113 | 0.03 |
20 | S. T. Gries | 209 | 0.13 | 42 | P. Baker | 105 | 0.01 |
21 | S. Granger | 209 | 0.06 | 43 | A. Wierzbicka | 102 | 0.02 |
22 | M. Stubbs | 206 | 0.04 | | | | |
期刊的质量与引文作者密切相关,利用 CiteSpace对收集的143 400篇参考文献进行作者共被引西元红河棋牌
,得到节点数66,连线数158的作者共被引图谱,如图4所示。每一个节点代表一位被引作者,节点大小表示该作者的被引频次,节点越大表示该作者的被引频次越高。
图4
国际语料库西元红河棋牌正版
高被引作者聚类图谱 结合表5和图4发现,被引频次和中心度排名都在前20的作者中,D. Biber、K. Hyland、J. Bybee、M. A. K. Halliday、E. C. Traugott、W. Labov和S. T. Gries都排在前列,这些作者在国际语料库领域均做出了卓越贡献。N. C. Ellis虽共被引只有117次,但中心度为0.12,表示其西元红河棋牌正版
内容是一个重要的转折点,他将语料库运用到二语习得西元红河棋牌正版
,为其他学者带来了重要启示。
2.3.3
作者合作西元红河棋牌
作者合作水平根据合作密度值来判断。密度指的是网络中各个成员之间联系的紧密程度,是指行动者之间实际联结的数目与他们之间可能存在的最大联结数目的比值,其高低代表群体成员平均互动程度的强弱,密度值越大,成员之间的联系就越密切
[15]。将处理好的矩阵导入Ucinet6,依次点击Network-Cohension-Density,进行合著网络的密度西元红河棋牌
,可以得出国际语料库西元红河棋牌正版
主体合作网络整体网络密Density(matrix average)为0.0131,标准差 Standard deviation为0.243 8,这表明国际语料库西元红河棋牌正版
主体合作水平不高,作者之间的联系较为松散。说明语料库领域西元红河棋牌正版
者团队之间沟通少,如果不同的西元红河棋牌正版
团队之间加强交流,则能给不同的团队注入新的活力,有利于玉溪西元棋牌
的分享和传播,进而促进该领域的发展。
同时,合作西元红河棋牌正版
中通常使用合作率(collaboration rate,CR)和合作水平(collaboration level,CL)两个指标度量合作程度。合作率是指作者数大于等2的论文数占全部论文数的比例,合作水平一般是用所有论文的平均作者合作度表示
[16]。由此可以得到语料库西元红河棋牌正版
的合作度为0.82,合作率为22.36%,合作度和合作率都很低。对独著者去重后西元红河棋牌
独著者为3 755人,重复人数占近39.4%,说明作者之间的合作有待加强。
2.4
文献国家和地区分布
考察文献的国家和地区是指文献第一作者所在的国家和地区。经统计共有57个国家/地区对语料库进行了西元红河棋牌正版
,发文量超过10篇以上的国家/地区见表6。由表6可知,美国、英国、西班牙、德国、比利时、中国和法国等是开展语料库西元红河棋牌正版
的主要国家,说明这些国家在语料库西元红河棋牌正版
领域已经形成比较专业的学术团队。2005年至今,中国发表在Web of Science的论文总数282篇,占总数的5.53%,但中心度为0.01,这表明中国在语料库西元红河棋牌正版
领域影响力很低,其西元红河棋牌正版
水平需提高。
表6
语料库西元红河棋牌正版
国家/地区文献发表情况 国家/地区 | 发文量 | 突现性 | 中心度 | 国家 /地区 | 发文量 | 突现值 | 中心度 |
USA | 895 | | 0.25 | NEW ZEALAND | 59 | | 0.03 |
ENGLAND | 595 | | 0.24 | ISRAEL | 49 | | 0 |
SPAIN | 573 | | 0.12 | BRAZIL | 42 | 4.43 | 0.02 |
GERMANY | 487 | | 0.22 | IRAN | 41 | | 0 |
BELGIUM | 338 | | 0.1 | SOUTH KOREA | 40 | | 0 |
PEOPLES R CHINA | 282 | | 0.01 | CZECH REPUBLIC | 37 | | 0.02 |
FRANCE | 240 | 7.3 | 0.03 | IRELAND | 32 | | 0.03 |
NETHERLANDS | 158 | | 0.12 | DENMARK | 31 | | 0.01 |
CANADA | 155 | | 0.04 | HUNGARY | 30 | 3.99 | 0 |
AUSTRALIA | 154 | | 0.16 | RUSSIA | 30 | | 0.01 |
ITALY | 149 | | 0.06 | ARGENTINA | 29 | | 0 |
SOUTH AFRICA | 120 | 8.4 | 0.01 | PORTUGAL | 28 | | 0.01 |
TAIWAN | 97 | | 0 | WALES | 27 | | 0.07 |
CHILE | 89 | | 0 | TURKEY | 24 | | 0.02 |
SWEDEN | 88 | | 0.03 | ESTONIA | 23 | 6.31 | 0 |
JAPAN | 86 | | 0 | MALAYSIA | 19 | | 0.01 |
SWITZERLAND | 86 | | 0.06 | SINGAPORE | 19 | | 0 |
SCOTLAND | 83 | | 0.02 | SLOVENIA | 16 | | 0 |
FINLAND | 71 | 3.12 | 0.02 | ROMANIA | 16 | 2.68 | 0 |
NORWAY | 68 | | 0 | GREECE | 15 | | 0.03 |
POLAND | 63 | | 0.01 | CROATIA | 13 | 3.3 | 0.01 |
AUSTRIA | 60 | | 0.02 | MEXICO | 11 | | 0.02 |
在 Cite Space 软件中将数据抽取阈值设置为Top 50 perslice,可将世界各国发表的论文数量及时间以年轮的大小和颜色直观地展示。在得到的语料库领域西元红河棋牌正版
的国家/地区综合西元红河棋牌
玉溪西元棋牌
图谱中(见图5),共有57个结点,220条连线,可以看出各国/地区间有较多合作,从而得出语料库西元红河棋牌正版
地区大致可以分为4个中心,分别是美国、英国、德国和西班牙。一个节点的中介中心度越高,说明它在网络中最短路径上出现的越多,其影响力和重要程度越大
[17-18]。从节点中心度来看,美国的节点中心度最大,说明美国与其他语料库西元红河棋牌正版
的地区存在某种程度上的合作关系,如英国、德国和西班牙等。从发文的突增性来看,南非的发文突增性最大,为8.4,这说明南非在2005-2017年发表的与语料库主题相关的论文数量有较大的突破。
通过节点Citation History功能可以捕获中国这一节点两个方面的详细信息:一方面图6清晰展示了中国 2005-2017的发文频次的变化情况,其中 2005-2017 近13年间中国在语料库领域的发文整体趋势上升;另一方面可以通过“Articles Published in This Country in 280 Records”的记录(即中国这一时期语料库的282篇施引文献的具体信息),进一步挖掘中国学者在语料库领域的分布信息。
2.5
国际语料库西元红河棋牌正版
机构西元红河棋牌
由于作者和机构之间具有从属关系,而机构在西元红河棋牌正版
领域上具有不同的侧重点,期刊的机构分布不仅体现了该刊的侧重领域和方向, 还体现了机构对刊物的支持和认同
[19]。因此,对西元红河棋牌正版
机构进行西元红河棋牌
,能够了解到某一领域核心科研机构的西元红河棋牌正版
动态,掌握该领域的西元红河棋牌正版
热点及发展趋势。因此,采用 CiteSpace软件,将时区选择(Time Slicing)设定为2005-2017年,时间分区切片选择1年;节点类型(Node Type)选择机构(institution),修剪(Pruning)选择寻径算法(Pathfinder)和修剪切片网络(Pruning sliced network)
[20],运行Citespace软件,生成国际语料库西元红河棋牌正版
机构的玉溪西元棋牌
图谱,如图7所示:
图7中共有184个节点,102条连线,网络密度为0.006 1,这表明语料库西元红河棋牌正版
仍处于发展阶段,大的成熟西元红河棋牌正版
团体尚未形成,更广范围的机构合作有待形成。其中比较成熟的西元红河棋牌正版
团队,如比利时根特大学为中心的连线较密,说明其与比利时鲁汶大学和比利时安特卫普大学有着较密切的合作。为了更清晰地了解国际科研机构对语料库领域的西元红河棋牌正版
情况,统计语料库西元红河棋牌正版
机构得到表7,由表7可以看出,比利时根特大学、比利时鲁汶大学、英国兰卡斯特大学、英国爱丁堡大学、英国伯明翰大学、美国宾夕法尼亚州立大学、法国国家科学西元红河棋牌正版
院、西班牙瓦伦西亚大学、比利时安特卫普大学、英国曼彻斯特大学和芬兰赫尔辛基大学等在语料库西元红河棋牌正版
领域排在前11位, 这些学校在高等教育西元红河棋牌正版
上处于领先的地位,其发文总数都在30篇以上,比利时根特大学发表123篇文献,文献数量排名第一。从中心度排序来看,比利时根特大学和比利时鲁汶大学的中心度最大,达到了0.12,这说明这两种机构与其他机构合作广泛。从突现性来看,比利时安特卫普大学和西班牙瓦伦西亚大学突现性数值较大,这说明这两个机构在语料库西元红河棋牌正版
上有较大的突破。
表7
Web of Science 收录语料库文献西元红河棋牌正版
机构分布 机构 | 频次 | 中心度 | 突现值 |
Ghent University (比利时根特大学) | 123 | 0.12 | |
Katholieke Universiteit Leuven (比利时鲁汶大学) | 88 | 0.12 | 4.57 |
Lancaster University (英国兰卡斯特大学) | 55 | 0 | |
The University of Edinburgh (英国爱丁堡大学) | 45 | 0.01 | 4.17 |
University of Birmingham (英国伯明翰大学) | 43 | 0.05 | |
Penn State University (美国宾夕法尼亚州立大学) | 40 | 0.01 | |
Centre National de la Recherche cientifique (法国国家科学西元红河棋牌正版
院) | 38 | 0.07 | 4.77 |
University of Valencia (西班牙瓦伦西亚大学) | 34 | 0 | 6.82 |
University of Antwerp (比利时安特卫普大学) | 33 | 0.07 | 7.4 |
The University of Manchester (英国曼彻斯特大学) | 32 | 0.01 | |
University of Helsinki (芬兰赫尔辛基大学) | 30 | 0 | |
2.6
国际语料库被引文献西元红河棋牌
某一领域期刊论文被引用频次在一定程度上说明该领域的学术西元红河棋牌正版
的理论水平和发展速度。通过西元红河棋牌
这些论文,不仅可以直观地了解该西元红河棋牌正版
领域在过去和当前的发展状况,还可以大概预测出其未来的发展趋势
[21]。利用 CiteSpace软件对文献数据进行可视化西元红河棋牌
,网络节点(node types)为被引文献(cited reference),得到共被引文献图谱,如图8所示:
从图8可以看出,此次西元红河棋牌
共生成了202个节点,381条连线,每个节点代表一篇被引文献,节点向外延伸的不同颜色与该文献所在年份的颜色相对应,节点越大表示被引频次越高,在一定程度上也代表该领域的西元红河棋牌正版
重点。整理共被引网络图谱,其共被引频次排名前5和中心度大于0.18的数据见表8和表9,美国学者A. Goldberg出版的著作Constructions at Work无论是被引频次还是中心度排名都在前三,这表明该书籍在语料库西元红河棋牌正版
领域具高影响力。
频次 | 文献名 | 作者(发表年份) |
78 | Analyzing linguistic data: a practical introduction to statistics using R | R. Baayen(2008) |
77 | Constructions at Work | A. Goldberg (2006) |
59 | The corpus of contemporary American English--a useful tool for English teaching and research | M. Davies(2008) |
57 | Wordsmith tools version 5, Liverpool: Lexical Analysis Software Ltd | M. Scott(2008) |
56 | The Cambridge grammar of the English language | R. D. Huddleston(2002) |
频次 | 文献名 | 作者(发表年份) |
0.28 | A usage-based exemplar model approach to Spanish verbs of “becoming” | J. Bybee (2006) |
0.25 | Lexical priming: a new theory of words and language | M. Hoey(2005) |
0.21 | Constructions at work | A. Goldberg (2006) |
0.19 | Constructing a Language: a usage-based theory of language acquisition | M. Tomasello (2003) |
0.18 | Language, usage and cognition | J. Bybee(2010) |
0.18 | An academic formulas list (AFL) | R. Simpson-Vlach(2010) |
0.18 | Humble servants of the discipline? self-mention in research article | K. Hyland(2001) |
在5篇共被引频次最高的文献中有4本专著都带有工具书性质,Analyzing linguistic data: a practical introduction to statistics using R是面向非数学背景学者展示怎样用R语言进行语言学语料西元红河棋牌
;The corpus of contemporary American English--a useful tool for English teaching and research介绍美国当代英语语料库(COCA)在英语教学和西元红河棋牌正版
中的应用;Wordsmith tools version 5, Liverpool: Lexical Analysis Software Ltd介绍语料库工具Wordsmith;The Cambridge grammar of the English language是基于描写语法的英语辞书,例句均来自真实语料。这些高频次共被引文献揭示出语料库语言学的一个重要特征,即实践性和工具性。语料库语言学是理论与实践的结合,尤其实践性是其突出特点。并且语料库工具和语料库本身都在不断更新、升级,Wordsmith 现在已经更新至7.0版本,COCA已经有了库容达到1.4亿的升级版iWeb。
在共被引最高频次和中心度最高的文献中均入选的
Constructions at work: the nature of generalization in language(《运作中的构式:语言概括性的本质》)
[22]具有重要的理论价值,是构式语法的扛鼎之作。其作者A. Goldberg提出的“构式”概念引起了整个语言学界的极大关注,其发展势头极为迅猛。某种意义上,构式主义已经形成独立的西元红河棋牌正版
流派。语料库与构式的结合既出于理论上的契合,又凸显了语料库的工具优势。
2.7
国际语料库西元红河棋牌正版
前沿热点
关键词是一篇文献的核心与精髓,是对主题的概括与凝练,反映文献的核心内容,也是文献计量西元红河棋牌正版
的重要指标,当多篇文章的关键词具有一致性时,这些文章的主题或多或少在一定程度上具有相关性。关键词共现玉溪西元棋牌
图谱能够将具有相同关键词的文章进行聚类,进而体现出同一西元红河棋牌正版
领域的关键节点,集中展现一段时间内相关文献的西元红河棋牌正版
热点,有利于从整体上把握已有西元红河棋牌正版
内容。同时,通过对关键词共现产生的中心性西元红河棋牌
可以揭示出西元红河棋牌正版
热点之间的转化关系,因此,本文利用已收集的文献数据库的关键词来西元红河棋牌
语料库的西元红河棋牌正版
热点。在CiteSpace软件中,将节点类型设置为“Keyword”,对5 096篇文献进行关键词共现西元红河棋牌
得到关键词共现的西元红河棋牌正版
热点图谱,运行结果表明,共有323个节点,930条连线,且密度为0.017 9,如图9所示。图9中带有紫色圆圈的关键词具有高中心性,是一个西元红河棋牌正版
热点向另一个西元红河棋牌正版
热点转化的重要转折点。
通常频次高的关键词被用来确定一个西元红河棋牌正版
领域的热点,表10列出了共现频次大于等于30的关键词及其序号、频次、突现值和中心度。从表10中可以看出,语料库语言学(corpus linguistics)作为关键词共现频次最多,有238次,且中心度为0.14,处于第5位,其中西班牙语(Spanish)、话语西元红河棋牌
(discourse analysis)、语料库(corpora)、词典编纂(lexicography)和句法(syntax)的突现值均非常高,表明这5个关键词是各自年份的热点。
序号 | 关键词 | 频次 | 突现值 | 中性度 |
1 | corpus linguistics | 238 | | 0.14 |
2 | corpus | 171 | | 0.09 |
3 | Spanish | 79 | 3.14 | 0.1 |
4 | grammaticalization | 78 | | 0.09 |
5 | collocation | 71 | | 0.06 |
6 | corpus analysis | 69 | | 0.08 |
7 | frequency | 69 | | 0.16 |
8 | English | 67 | | 0.17 |
9 | metaphor | 66 | | 0.06 |
10 | conversation analysis | 65 | | 0.1 |
11 | discourse marker | 62 | | 0.07 |
12 | academic writing | 58 | | 0.07 |
13 | genre | 57 | | 0.14 |
14 | variation | 52 | | 0.05 |
15 | discourse analysis | 50 | 3.17 | 0.04 |
16 | discourse | 50 | | 0.08 |
17 | translation | 50 | | 0.11 |
18 | pragmatics | 50 | | 0.06 |
19 | corpora | 49 | 2.69 | 0.15 |
20 | gender | 45 | | 0.16 |
21 | prosody | 45 | | 0.07 |
22 | French | 39 | | 0.1 |
23 | syntax | 36 | 3.51 | 0.05 |
24 | Dutch | 35 | | 0.03 |
25 | evaluation | 31 | | 0.07 |
26 | lexicography | 31 | 9.12 | 0.05 |
27 | semantics | 30 | | 0.12 |
为了进一步验证语料库西元红河棋牌正版
热点,在CiteSpace可视化图谱中利用Citation/Frequency Burst History得到如图10所示的高突变关键词时间线图谱,红色线条代表突变度发生显著变化的时间区间。
图10清晰地显示了2005-2017年西元红河棋牌正版
热点关键词的演变,但也需要具体甄别和阐释,如单独看“model”和“corpus analysis”没有意义。整体看语料库2005-2017年的西元红河棋牌正版
热点包括话语西元红河棋牌
(conversation analysis、 metadiscourse、politeness、discourse marker)、词典编撰(lexicography、dictionary)、词汇(morphology、word、collocation),此外还有音系学(phonology)、句法(syntax)、隐喻(metaphor)、性别(gender)、身份(identity)、文类(genre)。以上西元红河棋牌
显示一方面词典编撰和词汇搭配一直都是语料库语言学的重要课题,另一方面隐喻、性别、身份和文类等关键词往往和话语西元红河棋牌
、文学西元红河棋牌正版
及专门用途语言相关,这表明语料库语言学的西元红河棋牌正版
正在拓展到更多领域,并更加细致。延续到2017年的关键词包括话语标记、搭配(collocation)和德语(German)。德语成为一个热点关键词可能有两个原因:①有4本德国出版的期刊均为语料库核心期刊,西元红河棋牌正版
成果发表渠道较为丰富;②近年来关于德语的西元红河棋牌正版
比较活跃,如古/中高地德语的语料库建设和西元红河棋牌正版
等。