学术探索 已发表论文 版本  2 Vol 3 (4)  : 208-224 2018
下载
国际语料库语言学西元红河棋牌正版 热点与前沿的信息可视化西元红河棋牌
Information Visualization Analysis on the Research Hot Spots and Frontiers of International Corpus Linguistics
: 2018 - 05 - 23
: 2018 - 08 - 14
pornwimp.com fszsgj.com xxlwjz.com nchcqb.com 657184.com xsdhf.com 1150wavo.com dilmanj.com lbqklj.com
32929 57 0
摘要&关键词
摘要:[目的/意义]本西元红河棋牌正版 旨在更好地把握近几年国际语料库西元红河棋牌正版 发展的整体脉络和西元红河棋牌正版 成果,厘清该领域西元红河棋牌正版 的热点问题,探索其西元红河棋牌正版 的前沿。[方法/过程]以Web of Science核心数据库所收录国际期刊在2005-2017年间所刊载的西元红河棋牌正版 性论文作为数据来源,借助BICOMB、Ucinet6和CiteSpace软件对语料库相关西元红河棋牌正版 数据从文献数量与年代分布、来源期刊、西元红河棋牌正版 主体、国家和地区分布、西元红河棋牌正版 机构、被引文献等方面进行计量和玉溪西元棋牌 图谱西元红河棋牌 。[结果/结论]通过西元红河棋牌 发现,国际语料库语言学的西元红河棋牌正版 对象涉及到更多语种和文类,并越来越呈现出跨学科、多角度的特点。持续关注的西元红河棋牌正版 热点包括搭配和词典编撰,新热点包括专门用途语言、学术英语、性别、身份、隐喻及话语西元红河棋牌 ,与构式语法、认知语言学等的结合是西元红河棋牌正版 前沿。
关键词:语料库;可视化西元红河棋牌 ;BICOMB;Ucinet6;CiteSpace
Abstract & Keywords
Abstract: [Purpose/significance] This paper aims at grasping the overall context and research findings of international corpus research in recent years, clarifying the hot spots and exploring the research frontiers in this field. [Method/process] It took the research papers published between 2005 and 2017 in Web of Science as data source, and made calculate analysis and knowledge domains map on these data through the softwares including BICOMB, Ucinet6 and CiteSpace from the following aspects:publication numbers and chronological distribution, source journals, research subjects, national and regional distribution, research institutions and cited literature. [Result/conclusion] It found that corpus study presents the characteristics of interdisciplinary and multi-angle, and it’s research objectsinvolve more languages and literature genre. Collocation and lexicography keep being important studies while special purpose language, academic English, gender, identity, metaphor and discourse analysis turn into new research hotspots, and the combination with construction grammar and cognitive linguistics are the research frontiers.
Keywords: corpus; visualized analysis; BICOMB; Ucinet6; CiteSpace
pornwimp.com fszsgj.com xxlwjz.com nchcqb.com 657184.com xsdhf.com 1150wavo.com dilmanj.com lbqklj.com
“语料库”来自拉丁语“corpus”,意为“汇总”“文集”。一般认为1967年美国布朗语料库的建立和相关论文的发表标志着语料库西元红河棋牌正版 在现代语言学意义上的开端。但是20世纪60年代的美国盛行理性主义,语料库语言学最初是在欧洲得到发展;英国成为语料库西元红河棋牌正版 的重镇,并形成赞成和反对语料标注两种态度,前者代表如R. Quirk[1]、G. Leech[2]和T. McEnery[3],后者代表为J. M. Sinclair[4]。伦敦大学的R. Quirk在1959年宣布建立“英语用法调查”(The Survey of English Usage)语料库;英国新弗斯学派代表人物J. M.Sinclair主持COBUILD项目,建成科林斯英语语料库(The Bank of English);M. Baker 将语料库引入翻译西元红河棋牌正版 [5]。自此,语料库广泛应用于词典编撰、语法描述、二语习得、文学西元红河棋牌正版 及翻译西元红河棋牌正版 等领域[6-7]。美国第一次全国性语料库研讨会于1999年举办,开始迎头赶上;2001年第一届语料库语言学国际会议于英国兰卡斯特大学召开,国际交流进一步加强。相对于西方,我国的语料库语言学西元红河棋牌正版 起步较晚,但成果也颇为丰富,最早始于80年代上海交通大学科技英语计算机语料库(JDEST)的建立,2000年以后相关论文发表数量开始成倍增长。2003年,首个中国学习者英语语料库建成[8];2006年,王克非首次提出“语料库翻译学”的概念[9];2009年,首届全国语料库翻译学研讨会在上海交通大学召开;2011年,首届中国语料库语言学大会在北京外国语大学举行。
目前,随着计算机及网络技术的革新,语料库规模更大,美国杨百翰大学的iWeb语料库达到百亿词级;应用软件更优更新;语料库的应用领域更广;文献发表数量与日俱增。为了全面了解近年来国际语料库西元红河棋牌正版 的发展态势,把握该领域西元红河棋牌正版 的热点和前沿问题,本文运用BICOMB和CiteSpace等工具软件,对发表在Web of Science上的2005-2017年间国际语料库西元红河棋牌正版 文献进行西元红河棋牌 ,绘制可视化玉溪西元棋牌 图谱,期待为国内语料库西元红河棋牌正版 提供参考。
1     数据来源与西元红河棋牌正版 方法
1.1   数据来源
本西元红河棋牌正版 采集的数据来源于Web of Science(WOS)核心合集,该合集包括Sciences Citation Index(SCI)、Social Sciences Citation Index(SSCI)和Arts & Humanities Citation Index(AHCI)数据库,包括2005年至今科学、社会科学、艺术和人文科学领域的世界一流学术性期刊、书籍和会议录。以“corpus”or “corpora”为检索主题词进行检索,文献类型为论文(Article),学科领域限定为语言学(Linguistics和Language Linguistics),语种为英语(English),不限定出版时间,截至2017年12月5日共检索到英文文献5 096篇,基本涵盖了2005年以来国际学界语料库西元红河棋牌正版 的重要成果。文献数据包含全文本与引用的参考文献。
1.2    西元红河棋牌正版 方法
科学计量可视化软件的优势是迅速处理海量数据,并以可视化方式呈现,直观揭示数据特征。本文根据西元红河棋牌正版 对象和问题,选取了3个软件工具,分别是BICOMB[10]、Citespace和Ucinet6。通过BICOMB进行核心期刊与期刊共被引西元红河棋牌 、高产第一作者西元红河棋牌 和高被引作者西元红河棋牌 ;通过Ucinet6进行作者合作西元红河棋牌 ;通过CiteSpace对文献的数量趋势、期刊来源、国家和地区分布、西元红河棋牌正版 机构、共被引文献和前沿热点进行西元红河棋牌 。基于3个软件对5 096篇文献生成的可视化谱图及阐释,呈现出国际语料库语言学在过去13年间整体的发展趋势和特点,为后续西元红河棋牌正版 提供参考。
2     数据西元红河棋牌 和讨论
2.1    国际语料库文献数量
文献数量的变化情况是衡量该领域西元红河棋牌正版 进展的重要指标,经统计在WOS数据库共收录期刊文献5 096篇,年均文献量为392篇,各年代文献数量分布如图 1 所示。国际语料库西元红河棋牌正版 从2005年开始,该领域的整体西元红河棋牌正版 呈现上升趋势,其趋势可以分为4个阶段:①快速发展阶段。2005-2009年,这一阶段是语料库西元红河棋牌正版 的快速增长时期,文献数量保持稳步递增。②平稳发展阶段。2010-2012年,此阶段语料库西元红河棋牌正版 论文增长幅度不大,基本都在400篇左右。③再提速阶段。2013-2015年,这一阶段语料库西元红河棋牌正版 又呈现快速增长趋势,并且在2015年达到语料库西元红河棋牌正版 文献量的最大值622篇。④递减阶段。2015年至今,这一阶段文献数量逐步递减。


图1   Web of Science 核心收录的语料库西元红河棋牌正版 文献发表情况
2. 2     核心期刊与期刊共被引西元红河棋牌
通过对语料库领域相关期刊的分布情况进行西元红河棋牌正版 ,有利于了解该领域发文期刊的空间分布,并发现该领域的主流期刊及发展动态;同时,也有助于相关学者了解该领域的西元红河棋牌正版 进展及发文情况。2005-2017年刊出语料库的5 096篇文章分布在251个来源出版物,利用BICOMB 软件对发文期刊进行统计筛选,根据布拉德福定律确定语料库西元红河棋牌正版 文献的核心期刊。将全部文献划分为经典的3个区间,对各个区间的文献数和期刊数进行统计得到区域西元红河棋牌 表,如表1所示:
表1   原始数据集区域分布表
区域期刊数(种)占期刊总数比例(%)载文量(篇)占论文总数比例(%)平均载文密度(篇/种)布拉福德常数(n)
核心区197.571 73133.9791.11
相关区4417.531 67032.7737.952.315
外围区18874.901 69533.269.02.07
合计2511005 09610020.30
按照布拉德福定律,以论文为统计单元,将所有期刊按相关论文数降序排列并划分为论文总数大致相等的3个区域,统计各区域的期刊数,判断是否符合1∶n∶n2。此处,1∶n∶n2可以作为判断分布是否符合布拉德福定律的评估指标;比例越是接近1∶n∶n2,则布拉德福定律越显著,布布拉德福定律的应用也越准确[11]。表2中语料库3 个区域的期刊数为19∶44∶188,即 1∶2.315∶4.27(2.072),比例系数基本一致,原始数据能较好地满足布拉德福定律描述的条件。根据“核心区-相关区-外围区”的划分理论,得到19种核心期刊,如表2所示:
表2   语料库西元红河棋牌正版 核心期刊
序号来源期刊发文量(篇)百分比(%)累计百分比(%)
1JOURNAL OF PRAGMATICS (语用学期刊)2955.788 95.788 9
2INTERNATIONAL JOURNAL OF CORPUS LINGUISTICS
(语料库语言学国际期刊)
1563.061 28.850 1
3ENGLISH FOR SPECIFIC PURPOSES
(专门用途英语)
1142.237 011.087 1
4CORPUS LINGUISTICS AND LINGUISTIC THEORY
(语料库语言学和语言学理论)
961.883 812.971 0
5META (META: 译者期刊)841.648 414.619 3
6ENGLISH LANGUAGE & LINGUISTICS
(英语语言和语言学)
831.628 716.248 0
7JOURNAL OF ENGLISH FOR ACADEMIC PURPOSES
(学术英语期刊)
821.609 117.857 1
8COMPUTATIONAL LINGUISTICS
(计算语言学)
811.589 519.446 6
9NATURAL LANGUAGE ENGINEERING
(自然语言工程)
791.550 220.996 9
10REVISTA SIGNOS (符号学期刊)781.530 622.527 5
11TEXT & TALK (文本和谈话)751.471 723.999 2
12LEXIKOS (词典学)721.412 925.412 1
13LINGUISTICS (语言学)701.373 626.785 7
14LANGUAGE SCIENCES (语言科学)651.275 528.061 2
15IBERICA (伊比利亚)631.236 329.297 5
16COGNITIVE LINGUISTICS (认知语言学)611.197 030.494 5
17LITERARY AND LINGUISTIC COMPUTING
(文学与语言计算)
591.157 831.652 3
18LINGUA
(LINGUA:普通语言学国际评论)
591.157 832.810 0
19LANGUE FRANCAISE (法语)591.157 833.967 8
期刊共被引(Cited Journal)西元红河棋牌 是指两本或多本期刊被同一篇文献引用的现象,期刊共被引所反映的是各类期刊及学科的关联性,通过期刊共被引西元红河棋牌 可以获得某个西元红河棋牌正版 领域的玉溪西元棋牌 基础分布。采用CiteSpace软件对上述转化后的数据进行期刊共被引西元红河棋牌 。时间分段(Time Slicing)选择2005-2017年,时间切片(Years per lice)选择1,节点类型(Node Types)选择被引期刊(Cited Journal),切片上限(Top N per slice)选择50,运用软件进行可视化西元红河棋牌 结果如图2所示,图中节点较大的期刊是在国际语料库西元红河棋牌正版 领域具有较高影响力的期刊。按照中心度(取中心度前30位的期刊)排序统计,语料库西元红河棋牌正版 的重要被引期刊见表3。


图2   语料库西元红河棋牌正版 领域期刊共被引图谱
表3   被引期刊中心度排名前30 的期刊列表
中心度被引期刊被引频次中心度被引期刊被引频次
0.46LANGUAGE1 2830.07INTRO FUNCTIONAL GRA295
0.39INT J CORPUS LINGUIS6980.07LANG SPEECH174
0.34J PRAGMATICS1 1340.06COMPREHENSIVE GRAMMA380
0.32LONGMAN GRAMMAR SPOK5090.06J LINGUIST371
0.31COGN LINGUIST4850.06PRAGMATICS234
0.21APPL LINGUIST8250.06COMPUTATIONAL LINGUISTICS171
0.21COGNITION4260.06INT J LEXICOGR83
0.2J MEM LANG4170.06WOMEN FIRE DANGEROUS76
0.2TEXT3990.05TESOL QUART452
0.1LANG VAR CHANGE3650.05J ENGL LINGUIST254
0.1CAMBRIDGE GRAMMAR EN2650.05LANG COGNITIVE PROC164
0.1COGNITIVE SCI2480.05DISCOURSE PROCESS161
0.08ENGL LANG LINGUIST2360.05SPEAKING INTENTION A12
0.07ENGL SPECIF PURP5320.04CORPUS CONCORDANCE C194
0.07LINGUIST INQ3590.04J PHONETICS37
通过CiteSpace得到节点数124,连线数315的期刊共被引图谱(见图2)。被引期刊中心度排名前30的期刊见表3。19种核心期刊见表2。这些期刊发表的语料库语言学成果最多,影响力最大,应该重点关注。19种核心期刊中英国出版5种,荷兰4种,德国4种,法国、西班牙、美国、加拿大、智利、南非各1种;语料库语言学刊物2种,计算机语言学3种,专门用途语言3种,词典编撰1种,翻译1种,语言学4种,认知语言学1种,语用学2种,其他2种。发文量最大的前5种期刊分别是《语用学期刊》《语料库语言学国际期刊》《专门用途英语》《语料库语言学和语言学理论》和《META:译者期刊》,其中前两本期刊的中心度即影响力也是最高的。从核心期刊与期刊共被引情况可以看到,除自语料库西元红河棋牌正版 发端就与其密切相连的词典编撰、翻译、语法描述等领域外,语用学、专门用途英语、认知语言学也广泛地和语料库语言学产生联系,拓展了西元红河棋牌正版 深度和广度。美国语言学协会的刊物《语言》和德国德古意特出版社出版《认知语言学》发表的论文数量不是最多的,但被引中心度分别为第一和第五,也是语料库语言学的重要参考文献,并且证明了认知语言学和语料库的结合是一个新的西元红河棋牌正版 热点。
2.3    西元红河棋牌正版 主体西元红河棋牌
西元红河棋牌正版 主体指从事语料库西元红河棋牌正版 的学者,本文从高产第一作者、高被引作者和作者合作三方面西元红河棋牌 西元红河棋牌正版 主体。
2.3.1    高产第一作者西元红河棋牌
学术影响的广度和深度主要取决于学者所发表的西元红河棋牌正版 成果,通过确定某领域西元红河棋牌正版 的核心作者,可以大致发现该领域的玉溪西元棋牌 地图,从而促进这一领域的学术交流与合作。通过BICOMB2.0 软件对文献发文作者情况统计西元红河棋牌 ,5 096篇文献共涉及第一作者3 755人。根据洛特卡定律,当发文量为1篇的作者数占作者总数的比例低于60% 时,会形成核心作者群[12]。经统计,2005-2017年发文量为1篇的作者有2 968位,约占作者总数的79.04%,高于洛特卡定律提出的60% 标准,说明国际语料库领域未能够形成核心作者群。根据普赖斯定律M=0.749(Nmax)1/2[13],发文量大于等于3的作者为高产第一作者,共296人,本文统计发文量为6篇及以上的作者,具体如表4所示:
表4   2005-2017年语料库西元红河棋牌正版 部分作者统计
序号作者发文量(篇)序号作者发文量(篇)
1S. T. Gries1619I. M. P Martinez6
2G. M. de Schryver1220S. Wulff6
3K. Hyland1121J. Flowerdew6
4G. Parodi1022R. Venegas6
5D. Biber1023J. Parkinson6
6D. L. Liu924L. Flowerdew6
7P. Collins925E. Taljard6
8J. L. B. Arroyo926M. Charles6
9M. A. Jimenez-Crespo827P. Durrant6
10D. J. Prinsloo828S. F. Chung6
11N. C. Ellis829L. De Cuypere6
12S. A. Crossley830K. O′Halloran6
13P. Baker731L. Anderwald6
14M. Hilpert732A. Adel6
15A. Partington733C. Y. Lin6
16R. Moon734J. Owens6
17S.Crossley635M. Bednarek6
18C. Ruhlemann6
表4显示,国际从事语料库西元红河棋牌正版 的主要学者有S. T. Gries、G. M. de Schryver、K. Hyland、G. Parodi和D. Biber等人,这几位高产第一作者发表了10篇以上的高质量论文,他们是国际语料库西元红河棋牌正版 的领军人物。以S. T. Gries等为代表的核心作者总计发文1 146 篇,约占论文总数的22.5%,虽未达到普赖斯提出的50%标准[14],但贡献比较可观。这一方面说明这些核心作者是语料库西元红河棋牌正版 领域的主体,为语料库的发展做出了重要贡献;另一方面还说明语料库西元红河棋牌正版 的学者群学术影响力还不够大,致使核心作者群尚未形成。
为了进一步了解第一作者之间的合作情况,利用Citespace对收集的文献进行作者合作西元红河棋牌 ,得到图3所示的作者合作聚类图谱,图中节点代表被引作者, 节点越大表示作者的发文量越大。


图3   语料库西元红河棋牌正版 领域作者玉溪西元棋牌 图谱
图3中共有377个节点,102条连线,网络密度为0.001 4。其中,节点的大小与作者发文数量有关,节点间的连线表示作者间的合作关系。从图3可知,国际语料库领域形成了以S. T. Gries、G. M. de Schryver和K. Hyland等为代表的高发文作者群,这些作者是国际语料库领域的开拓者和集大成者。
下面仅对发文量前3位高产作者进行简要西元红河棋牌 :S. T. Gries在语料库西元红河棋牌正版 中累计发表英文论文16篇,居于首位。该学者是美国加利福尼亚大学语言学教授、定量语料库语言学家,同时还是一个以认知为导向的使用型语言学家,使用各种不同的统计方法来西元红河棋牌正版 语言的话题,比如使用语料库来西元红河棋牌正版 其主体的同质性与比较、联结与分散测量、N-gram识别与探索以及其他定量方法。G. M. de Schryver发表英文论文12篇,居于第二位,是比利时根特大学语言和文化系非洲语言学西元红河棋牌正版 教授,主要西元红河棋牌正版 语料库语言学、计算语言学,他和D. Joffe一起搭建了20个非洲语言语料库。K. Hyland发表英文论文11篇,居于第三位,是英国东安格利亚大学教授,香港大学应用语言学首席教授、应用英语西元红河棋牌正版 中心主任,国际著名应用语言学家,学术写作与语料库西元红河棋牌 领域世界领军学者。
2.3.2    高被引作者西元红河棋牌
被引频次是衡量西元红河棋牌正版 成果价值的重要指标,被引频次的高低可以反映出作者在相关领域的影响力,对语料库西元红河棋牌正版 期刊的高被引作者进行西元红河棋牌 ,可以发现影响语料库西元红河棋牌正版 的重要人物。通过BICOMB2.0软件对高被引作者进行统计西元红河棋牌 发现,143 400篇被引文献共涉及作者85 996人,以被引频次100为节点,得到高被引作者共43 人,具体情况如表5所示:
表5   2005-2017年语料库西元红河棋牌正版 高被引作者统计
序号被引作者被引次数中心度序号被引作者被引次数中心度
1D. Biber9250.3923P. J. Hopper2010.01
2M. A. K. Halliday5820.1624M. Davies2010
3J. Sinclair4540.0925W. Chafe1960.12
4R. Quirk4380.126E. A. Schegloff1880.03
5K. Hyland4180.2327B. Macwhinney1820.02
6W. Labov3730.1328K. Aijmer1730.05
7M. Scott3710.0529J. L. Bybee1650.02
8G. Leech3590.0530E. Goffman1600.06
9G. Lakoff3580.0631D. Bolinger1520.09
10R. W. Langacker3370.132R. D. Huddleston1510.08
11J. Bybee3300.233T. Mcenery1440.08
12S. Hunston2890.1134M. Baker1390.03
13J. M. Swales2810.0635S. C. Levinson1330.01
14P. Brown2640.0436D. Crystal1320.01
15W. Croft2500.0337H. H. Clark1260.05
16E. C. Traugott2310.1538H. Sacks1230.04
17A. Goldberg2300.0939N. C. Ellis1170.12
18N. Chomsky2210.0140N. Fairclough1140.03
29T. Givon2170.0341M. Haspelmath1130.03
20S. T. Gries2090.1342P. Baker1050.01
21S. Granger2090.0643A. Wierzbicka1020.02
22M. Stubbs2060.04
期刊的质量与引文作者密切相关,利用 CiteSpace对收集的143 400篇参考文献进行作者共被引西元红河棋牌 ,得到节点数66,连线数158的作者共被引图谱,如图4所示。每一个节点代表一位被引作者,节点大小表示该作者的被引频次,节点越大表示该作者的被引频次越高。


图4   国际语料库西元红河棋牌正版 高被引作者聚类图谱
结合表5和图4发现,被引频次和中心度排名都在前20的作者中,D. Biber、K. Hyland、J. Bybee、M. A. K. Halliday、E. C. Traugott、W. Labov和S. T. Gries都排在前列,这些作者在国际语料库领域均做出了卓越贡献。N. C. Ellis虽共被引只有117次,但中心度为0.12,表示其西元红河棋牌正版 内容是一个重要的转折点,他将语料库运用到二语习得西元红河棋牌正版 ,为其他学者带来了重要启示。
2.3.3    作者合作西元红河棋牌
作者合作水平根据合作密度值来判断。密度指的是网络中各个成员之间联系的紧密程度,是指行动者之间实际联结的数目与他们之间可能存在的最大联结数目的比值,其高低代表群体成员平均互动程度的强弱,密度值越大,成员之间的联系就越密切[15]。将处理好的矩阵导入Ucinet6,依次点击Network-Cohension-Density,进行合著网络的密度西元红河棋牌 ,可以得出国际语料库西元红河棋牌正版 主体合作网络整体网络密Density(matrix average)为0.0131,标准差 Standard deviation为0.243 8,这表明国际语料库西元红河棋牌正版 主体合作水平不高,作者之间的联系较为松散。说明语料库领域西元红河棋牌正版 者团队之间沟通少,如果不同的西元红河棋牌正版 团队之间加强交流,则能给不同的团队注入新的活力,有利于玉溪西元棋牌 的分享和传播,进而促进该领域的发展。
同时,合作西元红河棋牌正版 中通常使用合作率(collaboration rate,CR)和合作水平(collaboration level,CL)两个指标度量合作程度。合作率是指作者数大于等2的论文数占全部论文数的比例,合作水平一般是用所有论文的平均作者合作度表示[16]。由此可以得到语料库西元红河棋牌正版 的合作度为0.82,合作率为22.36%,合作度和合作率都很低。对独著者去重后西元红河棋牌 独著者为3 755人,重复人数占近39.4%,说明作者之间的合作有待加强。
2.4   文献国家和地区分布
考察文献的国家和地区是指文献第一作者所在的国家和地区。经统计共有57个国家/地区对语料库进行了西元红河棋牌正版 ,发文量超过10篇以上的国家/地区见表6。由表6可知,美国、英国、西班牙、德国、比利时、中国和法国等是开展语料库西元红河棋牌正版 的主要国家,说明这些国家在语料库西元红河棋牌正版 领域已经形成比较专业的学术团队。2005年至今,中国发表在Web of Science的论文总数282篇,占总数的5.53%,但中心度为0.01,这表明中国在语料库西元红河棋牌正版 领域影响力很低,其西元红河棋牌正版 水平需提高。
表6   语料库西元红河棋牌正版 国家/地区文献发表情况
国家/地区发文量突现性中心度国家 /地区发文量突现值中心度
USA8950.25NEW ZEALAND590.03
ENGLAND5950.24ISRAEL490
SPAIN5730.12BRAZIL424.430.02
GERMANY4870.22IRAN410
BELGIUM3380.1SOUTH KOREA400
PEOPLES R CHINA2820.01CZECH REPUBLIC370.02
FRANCE2407.30.03IRELAND320.03
NETHERLANDS1580.12DENMARK310.01
CANADA1550.04HUNGARY303.990
AUSTRALIA1540.16RUSSIA300.01
ITALY1490.06ARGENTINA290
SOUTH AFRICA1208.40.01PORTUGAL280.01
TAIWAN970WALES270.07
CHILE890TURKEY240.02
SWEDEN880.03ESTONIA236.310
JAPAN860MALAYSIA190.01
SWITZERLAND860.06SINGAPORE190
SCOTLAND830.02SLOVENIA160
FINLAND713.120.02ROMANIA162.680
NORWAY680GREECE150.03
POLAND630.01CROATIA133.30.01
AUSTRIA600.02MEXICO110.02
在 Cite Space 软件中将数据抽取阈值设置为Top 50 perslice,可将世界各国发表的论文数量及时间以年轮的大小和颜色直观地展示。在得到的语料库领域西元红河棋牌正版 的国家/地区综合西元红河棋牌 玉溪西元棋牌 图谱中(见图5),共有57个结点,220条连线,可以看出各国/地区间有较多合作,从而得出语料库西元红河棋牌正版 地区大致可以分为4个中心,分别是美国、英国、德国和西班牙。一个节点的中介中心度越高,说明它在网络中最短路径上出现的越多,其影响力和重要程度越大[17-18]。从节点中心度来看,美国的节点中心度最大,说明美国与其他语料库西元红河棋牌正版 的地区存在某种程度上的合作关系,如英国、德国和西班牙等。从发文的突增性来看,南非的发文突增性最大,为8.4,这说明南非在2005-2017年发表的与语料库主题相关的论文数量有较大的突破。


图5   国际语料库国家/地区可视化图谱
通过节点Citation History功能可以捕获中国这一节点两个方面的详细信息:一方面图6清晰展示了中国 2005-2017的发文频次的变化情况,其中 2005-2017 近13年间中国在语料库领域的发文整体趋势上升;另一方面可以通过“Articles Published in This Country in 280 Records”的记录(即中国这一时期语料库的282篇施引文献的具体信息),进一步挖掘中国学者在语料库领域的分布信息。


图6   中国在语料库领域的发文历史
2.5   国际语料库西元红河棋牌正版 机构西元红河棋牌
由于作者和机构之间具有从属关系,而机构在西元红河棋牌正版 领域上具有不同的侧重点,期刊的机构分布不仅体现了该刊的侧重领域和方向, 还体现了机构对刊物的支持和认同[19]。因此,对西元红河棋牌正版 机构进行西元红河棋牌 ,能够了解到某一领域核心科研机构的西元红河棋牌正版 动态,掌握该领域的西元红河棋牌正版 热点及发展趋势。因此,采用 CiteSpace软件,将时区选择(Time Slicing)设定为2005-2017年,时间分区切片选择1年;节点类型(Node Type)选择机构(institution),修剪(Pruning)选择寻径算法(Pathfinder)和修剪切片网络(Pruning sliced network)[20],运行Citespace软件,生成国际语料库西元红河棋牌正版 机构的玉溪西元棋牌 图谱,如图7所示:


图7   国际语料库领域机构玉溪西元棋牌 图谱
图7中共有184个节点,102条连线,网络密度为0.006 1,这表明语料库西元红河棋牌正版 仍处于发展阶段,大的成熟西元红河棋牌正版 团体尚未形成,更广范围的机构合作有待形成。其中比较成熟的西元红河棋牌正版 团队,如比利时根特大学为中心的连线较密,说明其与比利时鲁汶大学和比利时安特卫普大学有着较密切的合作。为了更清晰地了解国际科研机构对语料库领域的西元红河棋牌正版 情况,统计语料库西元红河棋牌正版 机构得到表7,由表7可以看出,比利时根特大学、比利时鲁汶大学、英国兰卡斯特大学、英国爱丁堡大学、英国伯明翰大学、美国宾夕法尼亚州立大学、法国国家科学西元红河棋牌正版 院、西班牙瓦伦西亚大学、比利时安特卫普大学、英国曼彻斯特大学和芬兰赫尔辛基大学等在语料库西元红河棋牌正版 领域排在前11位, 这些学校在高等教育西元红河棋牌正版 上处于领先的地位,其发文总数都在30篇以上,比利时根特大学发表123篇文献,文献数量排名第一。从中心度排序来看,比利时根特大学和比利时鲁汶大学的中心度最大,达到了0.12,这说明这两种机构与其他机构合作广泛。从突现性来看,比利时安特卫普大学和西班牙瓦伦西亚大学突现性数值较大,这说明这两个机构在语料库西元红河棋牌正版 上有较大的突破。
表7   Web of Science 收录语料库文献西元红河棋牌正版 机构分布
机构频次中心度突现值
Ghent University
(比利时根特大学)
1230.12
Katholieke Universiteit Leuven
(比利时鲁汶大学)
880.124.57
Lancaster University
(英国兰卡斯特大学)
550
The University of Edinburgh
(英国爱丁堡大学)
450.014.17
University of Birmingham
(英国伯明翰大学)
430.05
Penn State University
(美国宾夕法尼亚州立大学)
400.01
Centre National de la Recherche cientifique
(法国国家科学西元红河棋牌正版 院)
380.074.77
University of Valencia
(西班牙瓦伦西亚大学)
3406.82
University of Antwerp
(比利时安特卫普大学)
330.077.4
The University of Manchester
(英国曼彻斯特大学)
320.01
University of Helsinki
(芬兰赫尔辛基大学)
300
2.6    国际语料库被引文献西元红河棋牌
某一领域期刊论文被引用频次在一定程度上说明该领域的学术西元红河棋牌正版 的理论水平和发展速度。通过西元红河棋牌 这些论文,不仅可以直观地了解该西元红河棋牌正版 领域在过去和当前的发展状况,还可以大概预测出其未来的发展趋势[21]。利用 CiteSpace软件对文献数据进行可视化西元红河棋牌 ,网络节点(node types)为被引文献(cited reference),得到共被引文献图谱,如图8所示:


图8   被引文献共被引图谱
从图8可以看出,此次西元红河棋牌 共生成了202个节点,381条连线,每个节点代表一篇被引文献,节点向外延伸的不同颜色与该文献所在年份的颜色相对应,节点越大表示被引频次越高,在一定程度上也代表该领域的西元红河棋牌正版 重点。整理共被引网络图谱,其共被引频次排名前5和中心度大于0.18的数据见表8和表9,美国学者A. Goldberg出版的著作Constructions at Work无论是被引频次还是中心度排名都在前三,这表明该书籍在语料库西元红河棋牌正版 领域具高影响力。
表8   共被引频次排名前5的被引文献
频次文献名作者(发表年份)
78Analyzing linguistic data: a practical introduction to statistics using RR. Baayen(2008)
77Constructions at WorkA. Goldberg (2006)
59The corpus of contemporary American English--a useful tool for English teaching and researchM. Davies(2008)
57Wordsmith tools version 5, Liverpool: Lexical Analysis Software LtdM. Scott(2008)
56The Cambridge grammar of the English languageR. D. Huddleston(2002)
表9   共被中心度大于0.18的被引文献
频次文献名作者(发表年份)
0.28A usage-based exemplar model approach to Spanish verbs of “becoming”J. Bybee (2006)
0.25Lexical priming: a new theory of words and languageM. Hoey(2005)
0.21Constructions at workA. Goldberg (2006)
0.19Constructing a Language: a usage-based theory of language acquisitionM. Tomasello (2003)
0.18Language, usage and cognitionJ. Bybee(2010)
0.18An academic formulas list (AFL)R. Simpson-Vlach(2010)
0.18Humble servants of the discipline? self-mention in research articleK. Hyland(2001)
在5篇共被引频次最高的文献中有4本专著都带有工具书性质,Analyzing linguistic data: a practical introduction to statistics using R是面向非数学背景学者展示怎样用R语言进行语言学语料西元红河棋牌 ;The corpus of contemporary American English--a useful tool for English teaching and research介绍美国当代英语语料库(COCA)在英语教学和西元红河棋牌正版 中的应用;Wordsmith tools version 5, Liverpool: Lexical Analysis Software Ltd介绍语料库工具Wordsmith;The Cambridge grammar of the English language是基于描写语法的英语辞书,例句均来自真实语料。这些高频次共被引文献揭示出语料库语言学的一个重要特征,即实践性和工具性。语料库语言学是理论与实践的结合,尤其实践性是其突出特点。并且语料库工具和语料库本身都在不断更新、升级,Wordsmith 现在已经更新至7.0版本,COCA已经有了库容达到1.4亿的升级版iWeb。
在共被引最高频次和中心度最高的文献中均入选的Constructions at work: the nature of generalization in language(《运作中的构式:语言概括性的本质》)[22]具有重要的理论价值,是构式语法的扛鼎之作。其作者A. Goldberg提出的“构式”概念引起了整个语言学界的极大关注,其发展势头极为迅猛。某种意义上,构式主义已经形成独立的西元红河棋牌正版 流派。语料库与构式的结合既出于理论上的契合,又凸显了语料库的工具优势。
2.7    国际语料库西元红河棋牌正版 前沿热点
关键词是一篇文献的核心与精髓,是对主题的概括与凝练,反映文献的核心内容,也是文献计量西元红河棋牌正版 的重要指标,当多篇文章的关键词具有一致性时,这些文章的主题或多或少在一定程度上具有相关性。关键词共现玉溪西元棋牌 图谱能够将具有相同关键词的文章进行聚类,进而体现出同一西元红河棋牌正版 领域的关键节点,集中展现一段时间内相关文献的西元红河棋牌正版 热点,有利于从整体上把握已有西元红河棋牌正版 内容。同时,通过对关键词共现产生的中心性西元红河棋牌 可以揭示出西元红河棋牌正版 热点之间的转化关系,因此,本文利用已收集的文献数据库的关键词来西元红河棋牌 语料库的西元红河棋牌正版 热点。在CiteSpace软件中,将节点类型设置为“Keyword”,对5 096篇文献进行关键词共现西元红河棋牌 得到关键词共现的西元红河棋牌正版 热点图谱,运行结果表明,共有323个节点,930条连线,且密度为0.017 9,如图9所示。图9中带有紫色圆圈的关键词具有高中心性,是一个西元红河棋牌正版 热点向另一个西元红河棋牌正版 热点转化的重要转折点。


图9   关键词西元红河棋牌 可视化图谱
通常频次高的关键词被用来确定一个西元红河棋牌正版 领域的热点,表10列出了共现频次大于等于30的关键词及其序号、频次、突现值和中心度。从表10中可以看出,语料库语言学(corpus linguistics)作为关键词共现频次最多,有238次,且中心度为0.14,处于第5位,其中西班牙语(Spanish)、话语西元红河棋牌 (discourse analysis)、语料库(corpora)、词典编纂(lexicography)和句法(syntax)的突现值均非常高,表明这5个关键词是各自年份的热点。
表10   关键词频次和中心度
序号关键词频次突现值中性度
1corpus linguistics2380.14
2corpus1710.09
3Spanish793.140.1
4grammaticalization780.09
5collocation710.06
6corpus analysis690.08
7frequency690.16
8English670.17
9metaphor660.06
10conversation analysis650.1
11discourse marker620.07
12academic writing580.07
13genre570.14
14variation520.05
15discourse analysis503.170.04
16discourse500.08
17translation500.11
18pragmatics500.06
19corpora492.690.15
20gender450.16
21prosody450.07
22French390.1
23syntax363.510.05
24Dutch350.03
25evaluation310.07
26lexicography319.120.05
27semantics300.12
为了进一步验证语料库西元红河棋牌正版 热点,在CiteSpace可视化图谱中利用Citation/Frequency Burst History得到如图10所示的高突变关键词时间线图谱,红色线条代表突变度发生显著变化的时间区间。


图10   高突变关键词时间线图谱
图10清晰地显示了2005-2017年西元红河棋牌正版 热点关键词的演变,但也需要具体甄别和阐释,如单独看“model”和“corpus analysis”没有意义。整体看语料库2005-2017年的西元红河棋牌正版 热点包括话语西元红河棋牌 (conversation analysis、 metadiscourse、politeness、discourse marker)、词典编撰(lexicography、dictionary)、词汇(morphology、word、collocation),此外还有音系学(phonology)、句法(syntax)、隐喻(metaphor)、性别(gender)、身份(identity)、文类(genre)。以上西元红河棋牌 显示一方面词典编撰和词汇搭配一直都是语料库语言学的重要课题,另一方面隐喻、性别、身份和文类等关键词往往和话语西元红河棋牌 、文学西元红河棋牌正版 及专门用途语言相关,这表明语料库语言学的西元红河棋牌正版 正在拓展到更多领域,并更加细致。延续到2017年的关键词包括话语标记、搭配(collocation)和德语(German)。德语成为一个热点关键词可能有两个原因:①有4本德国出版的期刊均为语料库核心期刊,西元红河棋牌正版 成果发表渠道较为丰富;②近年来关于德语的西元红河棋牌正版 比较活跃,如古/中高地德语的语料库建设和西元红河棋牌正版 等。
3    结论
从文献发表数量看,语料库语言学西元红河棋牌正版 经历了快速发展,近年来每年均有大量高质量成果发表。在WOS数据库共收录期刊文献5 096篇,年均文献量为392篇,分布在251个刊物,其中核心期刊有19种,欧洲国家出版刊物占15本,美洲3本,非洲1本。这些期刊文献反映了近13年的语料库语言学西元红河棋牌正版 的最高水平,可重点关注。此外,荷兰、英国、德国均拥有4本及以上核心期刊,形成语料库西元红河棋牌正版 的中心,反过来进一步促进了本国西元红河棋牌正版 的发展,比如德语是近3年来的持续热点。事实上,针对印欧语系语言的西元红河棋牌正版 的确在语料库西元红河棋牌正版 中占据主流,针对其他语言的西元红河棋牌正版 一方面极具必要性,另一方面在发表渠道上不占优势。目前我国北京外国语大学和上海交通大学一北一南形成语料库西元红河棋牌正版 的两个核心,在创建英文期刊、进入国际学界方面大有可为。
在3 755位第一作者中,S. T. Gries、G. M. de Schryver、K. Hyland、G. Parodi和D. Biber等拥有最高发文量。被引文献共涉及作者85 996人,其中高被引作者共43人,D. Biber、K. Hyland、J. Bybee、M. A. K. Halliday、E. C. Traugott、W. Labov和S. T. Gries位居前列,这些作者在国际语料库领域都做出了卓越贡献。西元红河棋牌 作者合作水平后发现,语料库西元红河棋牌正版 的合作度为0.82,合作率为22.36%,合作度和合作率都很低。共被引文献还揭示出语料库语言学的一个突出特点是兼具理论性与实践性。高被引文献的作者往往也是重要的语料库建设者及软件开发者。此外,语料库的工具性并不能掩盖其理论价值,对理性主义的矫正,和构式语法的结合,语料库的建立对语言习得、翻译和语言本质的认识均有重要影响。
共有57个国家对语料库进行了西元红河棋牌正版 ,美国、英国、西班牙、德国、比利时、中国和法国等是开展语料库西元红河棋牌正版 的主要国家,比利时根特大学、比利时鲁汶大学、英国兰卡斯特大学、英国爱丁堡大学、英国伯明翰大学、美国宾夕法尼亚州立大学、法国国家科学西元红河棋牌正版 院、西班牙瓦伦西亚大学、比利时安特卫普大学、英国曼彻斯特大学和芬兰赫尔辛基大学等在语料库西元红河棋牌正版 领域排在前11位,处于领先的地位。中国学者在进行访问交流时可重点考虑这些学校。
词频、搭配、词典编撰与语料库语言学具有天然的联系,一直是重要的西元红河棋牌正版 内容,词频和搭配也是展开其他西元红河棋牌正版 的重要手段。近些年来,语料库西元红河棋牌正版 越来越呈现出跨学科、多角度的特点。专门用途语言、学术英语,不同文类、不同语种均成为西元红河棋牌正版 对象。性别、身份、隐喻及话语西元红河棋牌 成为新的西元红河棋牌正版 热点。基于语料库的话语西元红河棋牌 、语料库文体学相继涌现,与构式语法、认知语言学的结合是西元红河棋牌正版 前沿。我国在语料库翻译学、学习者语料库、汉语语料库建设方面成果颇丰,是国际语料库语言学西元红河棋牌正版 的一部分。对国际西元红河棋牌正版 热点和前沿的关注有利于人们拓展和深入现有西元红河棋牌正版 ,也有利于与国际学界进行更有效的对话。
[1]
QUIRK R. Words at work: lectures on textual structure [M]. Singapore: NUS Press, 1986.
[2]
LEECH G. Corpora, the linguistics encyclopedia[M]. London:Routledge,1991.
[3]
McENERY T, XIAO R, TONO Y. Corpus-based language studies:an advanced resource book[M]. London: Routledge,2006.
[4]
SINCLAIR J. Corpus, concordance, collocation[M]. Oxford: Oxford University Press,1991.
[5]
BAKER M. Corpus linguistics and translation studies: implications and applications [C] // BAKER M, FRANCIS G, TOGNINI-BONELLI E. Text and technology: in honour of John Sinclair. Philadelphia: John Benjamins,1993 :233-250.
[6]
ATKINS S, CLEAR J, OSTLER N. Corpus design criteria[J].Literary and linguistic computing, 1992, 7 , (1):1-16.
[7]
RENOUF A. Teaching corpus linguistics to teachers of English [C] //WICHMAN A, FLIGELSTONE S, McENERY T, et al. Teaching and language corpora. New York: Longman, 1997: 255-266.
[8]
桂诗春,杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社,2003.
[9]
王克非.语料库翻译学——新西元红河棋牌正版 范式[J].中国外语,2006(3):8-9.
[10]
崔雷,刘伟,闫雷.文献数据库中书目信息共现挖掘系统的开发[J].现代图书情报技术,2008(8):70-75.
[11]
杨利军,吴智君.低被引文献对布拉德福定律的影响西元红河棋牌正版 [J].情报理论与实践,2016,39(9):43-46.
[12]
褚旭,熊华军.2000年以来我国教育技术论文作者可视化西元红河棋牌 ——基于《中国电化教育》和《电化教育西元红河棋牌正版 》载文[J].重庆高教西元红河棋牌正版 ,2015(6):100-108.
[13]
洪波.我国高等职业教育西元红河棋牌正版 的玉溪西元棋牌 图谱西元红河棋牌 ——基于1992-2016年核心期刊文献[J].职业技术教育,2017,38(6):45-50.
[14]
孙雨生,陈卫. 我国网格服务西元红河棋牌正版 进展——基于CNKI(2003-2012)的文献计量与玉溪西元棋牌 图谱西元红河棋牌 [J]. 现代情报,2013,33(7):102-111.
[15]
廉同辉,余菜花,宗乾进.我国旅游网站的网络结构西元红河棋牌正版 ——基于社会网络西元红河棋牌 法[J].旅游科学,2012,26(6):80-88.
[16]
WALTMAN L, van ECK N J, van LEEUWEN T N, et al. Towards a new crown indicator: an empirical analysis[J]. Scientometrics , 2011 87 (3) :467-481.
[17]
刘则渊,陈悦,侯海燕,等.科学玉溪西元棋牌 图谱:方法与应用[M].北京:人民出版社,2008.
[18]
林德明,陈超美,刘则渊,等.共被引网络中介中心性的Zipf-Pareto分布西元红河棋牌正版 [J].情报学报,2011, 30(1):76-82.
[19]
姜春林,胡志刚.《管理学报》2004-2009年载文计量西元红河棋牌 [J].管理学报,2010,7(8):1137-1143.
[20]
索璠冰.基于CiteSpace和文献计量的国内云计算西元红河棋牌正版 现状西元红河棋牌 [J].图书情报导刊,2017,2(6):60-65.
[21]
李旭辉,李超,魏瑞斌,等.基于CSSCI的信息消费被引文献计量西元红河棋牌正版 [J].图书馆工作与西元红河棋牌正版 ,2014(4):104-108.
[22]
GOLDBERG A. Constructions at work: the nature of generalization in language [M]. Oxford: Oxford University Press, 2006.
pornwimp.com fszsgj.com xxlwjz.com nchcqb.com 657184.com xsdhf.com 1150wavo.com dilmanj.com lbqklj.com
稿件与作者信息
杨柳
Yang Liu
youngwillow@126.com
副教授,博士
0000-0002-3588-0787
pornwimp.com fszsgj.com xxlwjz.com nchcqb.com 657184.com xsdhf.com 1150wavo.com dilmanj.com lbqklj.com
出版历史
出版时间: 2018年8月14日 (版本2
参考文献列表中查看
玉溪西元棋牌 管理论坛
None
pornwimp.com fszsgj.com xxlwjz.com nchcqb.com 657184.com xsdhf.com 1150wavo.com dilmanj.com lbqklj.com