学术探索 已发表论文  版本  1 Vol 8 (1)  2023
下载
NPCN:基于向心引用网络的专利被引频次标准化方法西元红河棋牌正版
NPCN: A New Method of Patent Citations Normalization Based on Ego Patent Citation Networks
: 2022 - 09 - 29
: 2023 - 02 - 20
pornwimp.com fszsgj.com xxlwjz.com nchcqb.com 657184.com xsdhf.com 1150wavo.com dilmanj.com lbqklj.com
49 0 0
摘要&关键词
摘要:[目的/意义] 专利的被引频次是衡量专利影响力的重要指标。由于专利的引用潜力因学科和发表年份的不同而呈现出巨大差异,因此专利的被引频次需要标准化之后才可以实现跨学科、跨年份比较。[方法/过程]基于专利向心引用网络构建一个新的专利被引频次的标准化指标——NPCN。为了验证该指标的有效性,从Dimension数据库中获取2005-2010年3D打印领域已获授权的专利,将其按照FoR分类进行学科划分,西元红河棋牌 不同学科、不同年份的专利在被引频次和NPCN分布情况,并采用比均值法、比参考文献法、Z score、NPCN对比它们与专利被引频次的相关关系。[结果/结论]3D打印领域的专利在22个FoR学科分类中均有分布,但不同学科、不同年份的专利在被引频次上差距较大,经过NPCN标准化处理之后,不同专利之间差距变小,呈现出明显的同分布趋势。在相关性方面,NPCN相对其他标准化指标来说与被引频次的相关程度低。
关键词:向心引用网络;专利被引频次;标准化指标;跨学科比较;跨年份比较
Abstract & Keywords
Abstract: [Purpose/Significance] The number of citations received by patents is an important indicator to measure the influence of patents. Since the citation potential of patents varies greatly by disciplines and publication years, the number of citations received by patents needs to be normalized before cross-disciplinary comparison and cross-year comparison. [Method/Process] Based on ego patent citation network, we constructed a new method, NPCN, to normalize patent citations. Besides, we took patents granted from 2005 to 2010 of 3D printing indexed in Dimensions to verify the effective of NPCN. Specially, we divided these patents into different disciplines with Fields of Research (FoR) and compared the distribution of patent citations and NPCN of patents in different disciplines and publication years. Besides, we also selected the mean method、reference patents method、Z-score method and NPCN methods and compared them with each other in correlation with patent citations. [Results/Conclusions] Patents of 3D printing are categorized into 22 FoR. And it is different between patents in the number of citations. After normalized, the difference between patents in different disciplines and publication years is smaller and a normalized citation distribution is shown. In correlation with patent citations, NPCN is less correlated with patent citations than other normalized methods.
Keywords: ego citation networks; patent citations; normalized indicators; cross-disciplines comparison; cross-year comparison
pornwimp.com fszsgj.com xxlwjz.com nchcqb.com 657184.com xsdhf.com 1150wavo.com dilmanj.com lbqklj.com
1   引言
专利被引频次是衡量专利影响力的重要指标,被引频次高的专利一般有着较高的质量[1]、技术价值[2]、创新程度[3]以及较广的玉溪西元棋牌 流动方向[4]。但由于不同学科发表和引用习惯的不同,不同学科专利的被引频次不能直接进行比较[5]。例如生物医学领域专利发文量大、更新速度快,专利的被引频次也较高,但数学、物理学等领域,科研周期较长,引文积累所需要的时间更久,专利被引频次也普遍低于生物医学领域的专利[6]。即使在同一学科中,发表时间早的专利通常比发表时间晚的专利有着更高的被引频次[7]。为了消除这种差异,对不同学科、不同年份专利的影响力进行公平合理的测度和评价,科研工作者往往需要一种标准化的方法对不同专利的被引次数进行数学变换,使得标准化后的被引频次达到近似同分布的效果,以实现专利的跨学科、跨年份比较[8]。专利是技术创新的载体,对不同专利的被引频次进行合理的比较,对于识别重要专利、探索技术发展路线以及评估专利价值等具有重要的意义。
引文标准化的基本思想是尽可能消除对引用潜力产生干扰的变量的影响,如学科领域、发表年份、文献类型等。早在20世纪80年代,引文标准化的西元红河棋牌正版 引起了科研人员的关注。近年来,越来越多的学者基于不同的理论和模型提出了多种标准化方法。总体来看,引文标准化主要归纳为两种,分别是从被引端进行标准化和从施引端进行标准化[9]。被引端的标准化是通过固定的学科分类体系来修正不同学科、不同年份之间的引用潜力差异,目前最为常见的方法主要包括基于篇均被引频次[10]、基于篇均参考文献数[11]以及基于百分位数的标准化[12]3种。施引端的标准化方法对不同学科领域施引专利的引用潜力进行修正,常见的施引端标准化方法有活跃参考文献[13]、标准化引文分数[14]、pi指数[15]等。
笔者在相关西元红河棋牌正版 综述的基础上,提出了一种基于专利的向心引用网络的被引频次标准化指标。为了验证该指标的有效性,笔者将3D打印领域2005-2010年期间发表的专利划分到不同的学科中,并对发表在不同学科、不同年份的专利进行标准化处理,最后还选取其他3种标准化指标和NPCN(normalized patent citations based on network)对比西元红河棋牌 它们与专利被引频次间的相关关系。根据伍军红等的西元红河棋牌正版 结果[7],理想的标准法指标可以使不同对象的被引频次呈现同分布的趋势,从而可以对它们的影响力进行比较。笔者采用相同的评价标准来判断向心网络指标的有效性。
2    相关西元红河棋牌正版 综述
已有的标准化方法主要是用来消除不同发表时间、不同领域的论文在被引频次上的差异。专利的被引频次可以用来反映专利的质量,这跟论文被引频次的作用有一定的相似性[16]。但不同专利之间因发表年份、技术领域存在着一定的差异[17],因此,将论文标准化方法扩展应用到专利西元红河棋牌 中是一个值得开拓的西元红河棋牌正版 内容。
2.1    参考标准的选择
目前,被引频次标准化方法主要是学科标准化,标准化过程中选取的学科参考标准主要是用来表征引用潜力,参考标准的确定为被引频次标准化奠定了基础,从而实现对不同学科领域的比较[9]。固定的学科分类体系是常用的参考标准,如Web of Science的JCR分类,但是这种分类会存在主题交叉重叠、多学科期刊论文无法归入具体的学科等问题[18]。除此之外,基于JCR分类的标准化指标容易受到论文聚类水平的影响,在不同聚类水平可能得出截然不同的结论[19]。因此,西元红河棋牌正版 人员对参考标准的选取进行了许多改进与探索。在对JCR分类体系进行改进的基础上,W. Glanzer等提出多学科期刊(如NatureScience)所发表的论文可以根据其参考文献将其配到相应的学科中,解决了很多论文无法分类的问题[20];针对JCR中学科主题交叉重叠问题,N. Rons利用PBFN(partition-based field normalization)方法来获得更详细的分类体系,这种办法可以将所涉及的重叠主题单独划为一个独立主题类来实现被引频次标准化[21]。另外,使用其他学科分类也是确定参考标准的一种选择,L. Bornnman等建议采用诸如化学文摘数据库或医学主题词表对某些特定学科的论文进行分类[22]。针对现有参考标准的弊端,有西元红河棋牌正版 人员提出新的学科分类体系,例如,L. Waltman等提出一种基于引用聚类的学科分类体系,这种方法可以覆盖所有的论文且每篇论文只归入唯一的学科[23]。R. Kostoff等利用专家意见来确定与特定论文有着相似主题的论文集,并认为只有将待评价论文的引文数量与相似论文集的引文数量做比较时,标准化方法才有意义[24]。C. Colliander基于共有的参考文献和主题词代替专家意见获得相似论文集,简化了数据集的获取流程。除了固定的学科分类体系外,论文的参考文献、引证文献或期刊等也可以作为论文的参照标准[25]。A. Schubert等将论文所属期刊作为参照标准来计算相对影响指标[26];B. I. Hutchins等通过构建论文共引网络作为论文的参照标准,提出了一种论文学术影响力评价的新指标[27]
2.2    被引频次标准化方法西元红河棋牌正版
不同学科间的相互比较需要对被引频次进行标准化处理已经成为共识。目前,被引频次标准化处理主要有两种方式:从被引端进行标准化以及从施引端进行标准化。从被引端进行标准化的西元红河棋牌正版 由来已久,相对引用指标是最常用的方法,它是指以论文的被引频次除以论文所在学科的平均被引频次来进行标准化,论文所在学科的平均被引频次可以视为论文期望被引频次[10]。根据计算顺序的不同,相对影响指标可以分为AoR(averages of ratios)和RoA(ratios of averages)两种。2015年,G. Abramo等提出了FSS指标来评估科学家个人学术影响力,该指标在相对引用指标的基础上,将作者贡献率纳入考虑范围,并用此来评估科学家的成就[28];G. Abramo等比较了多种指标,并认为所有只考虑论文比值的指标都是无效的,任何在此基础上的改进都是徒劳[29]。在诸多有关相对引用指标的讨论中,基于百分位数的标准化指标也被提出。基于百分位数的标准化指标将论文分成若干等级,不再使用数学平均值的计算方法,而是用分布情况来描述被引频次。L. Bornmann等认为用分布要优于算数平均值,进而提出将百分位数指标代替平均值算法的评价方法[11]。在基于百分位数的标准化指标的西元红河棋牌正版 中,L. Bornmann等还将论文根据被引频次分成6个等级并对不同的等级分布赋予不同的权重并对各个百分位分布概率进行加权平均[12]。除此之外,基于篇均参考文献数也是一种从被引端进行标准化的方法。E. Garfield等认为衡量某领域论文引用潜力最准确的指标是该领域篇均参考文献的数量[30]。2011年,M. Kosmulski提出NSP(number of successful paper)指标,即论文标准化处理可以用论文的被引频次除以其参考文献数[31]。随后,诸多西元红河棋牌正版 将论文集的平均参考文献数代替单篇论文的参考文献数,相应的标准化指标也随之而生,如CSNCR(citation score normalized by cited references)、MCSNCR(mean citation score normalized by cited references)、SNCS(source normalized citation score)等[11]
基于施引端的标准化方法是修正基于不同学科领域施引论文或期刊引用行为的方法。1985年,H. Small等首次应用于共被引西元红河棋牌 并以此来平衡不同学科或领域论文共被引值的差异[32]。之后,L. Waltman等借鉴施引端标准化方法的思想提出了标准化引文分数,该方法统计基于单篇施引文献的参考文献数量作为标准化的参考标准,从而跨学科地比较论文的学术影响力[14],标准化引文分数基于施引文献的参考文献数量来加权引文影响力,但是不同学科的活跃参考文献数存在着显著差异,为了消除学科间的差异,L. Waltman等又引入pi指数用于降低不同被引密度学科在计量中所产生的差异,类似方法已经在实证西元红河棋牌正版 中得到证明[15]。此外,L. Waltman等还将上述两种指标与SNCS与MNCS(mean normalized citation score)进行比较,结果发现不同的指标在不同的语境中表现效果不同[33]
通过对相关的西元红河棋牌正版 进行梳理和总结,我们可以看出现有西元红河棋牌正版 还存在着以下不足:①标准化方法将论文学科平均特征作为其引文潜力的表征,并不是使用目标论文本身的特征;②大多数标准化方法西元红河棋牌正版 并没有兼顾论文的被引情况和施引情况;③目前的被引频次标准化方法尚未拓展到专利西元红河棋牌 中。
3   基于向心引用网络的指标构建
3.1    专利向心引用网络
在网络理论中,如果将引用网络的聚焦点放在特定的目标节点时,我们称之为向心(或“自我中心”)[34]。在专利的向心引用网络中,网络的聚焦点是某篇特定的专利。笔者构建了专利p的向心引用网络(见图1),其中网络的节点代表着不同的专利,网络的边代表的是不同专利之间的引用关系[35]。从p的角度来看,向心引用网络可以具体分为4个子网:CC子网、RC子网、CR子网和RR子网。


图1   专利向心引用网络
CC子网包含所有引用p的专利的施引专利。通过CC子网,可以确定专利p在其前向引用网络中的相对位置,依据的标准是p及其前向引用专利的被引量,所以笔者只选择二阶引用来构建CC子网。
RC子网包含所有引用p的专利的参考专利。RC子网中的专利与专利p存在“共被引”关系。从专利p的角度来看,RC子网利用专利p的“共被引”关系来测度其作为玉溪西元棋牌 来源对后续施引专利的影响程度。
CR子网包含所有被p引用的专利的施引专利。CR网络中的专利与专利p存在着“耦合”关系。从p的视角来看,CR子网通过“耦合”关系测度专利p的玉溪西元棋牌 基础和技术复杂性。
RR网络包含所有被p引用的专利的参考专利。从专利p的视角来看,RR子网使用p的“施引”关系来确定其在二代后向引用网络中的相对位置。
和被引频次从不同的维度反映专利的特征,其中参考文献反映的是专利的玉溪西元棋牌 基础和本身的技术复杂性,被引频次反映专利被其他专利使用的程度[35]。在专利发表之后,向心引用网络中的RR子网中的节点和边便不再发生变化,但CR子网、RC子网和CC子网的节点和边仍然随着时间而增加。
3.2    指标构建
笔者构建了一个全新的网络指标来标准化专利的被引频次。该部分以专利p为例详细介绍网络指标NPCN,其计算公式如下:
\(\mathrm{N}\mathrm{P}\mathrm{C}\mathrm{N}=\frac{{CIT}_{p}}{TSI}\) 公式(1)
其中,CITp是指专利p的被引频次,TSI(technological span index)是专利的技术跨度指标。TSI是由X. Hu、 R. Rousseau和J. Chen在2012年提出[35],它是测度专利的预期影响力的指标。TSI可以表达为专利的外生指数(OIp)和专利技术兴趣指数(TII)的乘积,其计算公式如下:
\(\mathrm{T}\mathrm{S}\mathrm{I}={\mathrm{O}\mathrm{I}}_{\mathrm{p}}\mathrm{*}\mathrm{T}\mathrm{I}\mathrm{I}\) 公式(2)
专利的外生指数(OIp)反映的是专利p在包含该专利和其参考专利所组成的网络中的相对位置,它可以表达为:
\({\mathrm{O}\mathrm{I}}_{\mathrm{p}}=1-\frac{{R}_{p}}{T\left(p\right)+1}\) 公式(3)
其中,T(p)指被p所引用的专利数量。另外,将专利p和其参考专利共同组成一个专利集并将它们按被引频次倒序进行排列,Rp指专利p在专利集中的顺序。
专利的技术兴趣指数(TII)测度的是从参考专利流向专利p的技术玉溪西元棋牌 的创新密度,TII可以用以下的公式进行计算:
\(\mathrm{T}\mathrm{I}\mathrm{I}=\sqrt{{CIT}_{T\left(Rp\right)}}\) 公式(4)
其中,CITT(Rp)是专利p所有参考专利的被引频次之和(见图1的CR子网)。
在实际操作时,p的参考专利有以下3种情况:①无参考专利;②参考专利数量不为0但均未被引用;③参考专利数量不为0且至少1篇参考专利被引用过。在前两种情况下,专利p的TSI指数为0。因此,在本西元红河棋牌正版 中不考虑前两种情况。
4    数据来源与学科分类
4.1    数据来源
3D打印技术是20世纪80年代中期开始发展的一项颠覆性技术[36-37]。它无需任何模具或机械加工,就能直接从计算机图形数据中生成任何形状的零件,从而极大地缩短产品的研制周期,提高产品的生产率。近些年来,有关3D打印的专利数量呈现持续增长的趋势,目前该技术已广泛应用于工业设计和生物技术等领域。因此,对3D打印领域的专利进行合适的标准化处理有助于测度和评价该领域的技术影响力。本西元红河棋牌正版 选取Dimensions数据库作为数据来源,Dimensions数据库包含专利、论文以及参考信息和引文信息等,而且提供编程的途径来批量下载这些信息,这使得Dimensions成为西元红河棋牌 专利被引频次标准化的理想选择[38-39]。基于此,本西元红河棋牌正版 制定如下的检索式:title_abstract_claims:((three dimensional print*) OR (3 dimensional print*) OR (3D print*) OR (3-D print*) OR (additive manufactur*) OR (material increas* manufactur*) OR (rapid manufactur*) OR (rapid prototyp*) OR (layer* manufactur*))。考虑到专利被引频次分布的情况,笔者要保证专利至少有10年的被引时间以使引文稳定可靠[40],同时也消除短时间窗口可能带来的弊端[41],因此,将专利的出版时间限定在2005-2010年,检索时间为2022年6月,一共获得415 827条已授权的专利数据。再进一步,笔者利用Dimensions数据库提供的API下载专利的参考专利和施引专利,并逐一构建每条专利的向心引用网络。
4.2   学科分类的选取
本西元红河棋牌正版 使用Fields of Research (FoR)分类来界定专利的学科分类。FoR分类是澳大利亚和新西兰在2008年共同开发的分类体系,它一共包含22个类目[42]。Dimensions数据库采用机器学习和专家意见相结合的方法将其收录的专利划分为最为合适的一到多个FoR类目中[43]。在本西元红河棋牌正版 中,如果专利被划分为多个不同的类目,则将分别在不同学科对该专利的被引频次进行标准化[44]
5    西元红河棋牌正版 结果
5.1    描述性统计西元红河棋牌
表1逐年展示了2005-2010年期间专利数量的描述性统计西元红河棋牌 结果。由于使用全计数法来对专利进行分类[42],所以各学科的专利数量总数略大于下载的专利数量。由表1的统计结果可以看出,在2005-2010年,3D打印领域发表的专利数量庞大而且保持在一个相对稳定的状态,而且在22个FoR分类中均有涉及,其中,分布最多的6个类别分别是09 Engineering、03 Chemical Sciences、08 Information and Computing Sciences、02 Physical Sciences、11 Medical and Health Sciences、06 Biological Sciences,由此说明,3D打印技术的发展与工程、化学、信息技术、物理以及医学等领域之间密切相关。
表1   描述性统计西元红河棋牌 结果
代码学科名称2005年2006年2007年2008年2009年2010年
01Mathematical Sciences987375969095
02Physical Sciences2 2972 4632 3542 0262 0922 160
03Chemical Sciences6 9456 9587 8217 2427 5907 824
04Earth Sciences95102105117116169
05Environmental Sciences756880739883
06Biological Sciences1 5761 5371 6361 6731 7121 716
07Agricultural and Veterinary Sciences748173809587
08Information and Computing Sciences2 6082 7182 8582 7672 3982 459
09Engineering47 49652 12752 77449 90550 38252 557
10Technology9371 0181 0631 0301 0861 170
11Medical and Health Sciences1 8791 7961 9391 8981 9041 844
12Built Environment and Design6761067
13Education322587
14Economics575351355247
15Commerce, Management, Tourism and Services191012161315
16Studies in Human Society7577658283101
17Psychology and Cognitive Sciences273261254272253244
18Law and Legal Studies7471073
19Studies in Creative Arts and Writing664751778667586596
20Language, Communication and Culture12112211393101102
21History and Archaeology372734392424
22Philosophy and Religious Studies252234
总计65 34470 26072 10268 13868 69971 314
5.2   不同学科专利被引频次标准化后的效果
为了验证NPCN标准化的效果,笔者分别对比不同学科的专利被引频次和NPCN的平均分布和整体分布情况(见表2)。从平均情况来看,各学科的专利在被引频次方面差异明显,例如:13 Education领域的专利被引频次的平均值和中位数均最大为46.50,而07 Agricultural and Veterinary Sciences领域的专利被引频次的平均值和中位数为6.71,前者是后者的6.93倍之多。由此可见,发表于不同学科的专利在被引频次不具有直接可比性。而经过标准化处理之后,不同学科的专利NPCN平均值分布范围变为[3, 5.75],中位数的变化范围为[2.54, 5.75],由此可以看出专利NPCN平均值最大的学科和最小的学科之间的差异仅为1.92倍,中位数最大的学科与最小的学科之间的差异为2.26倍。所以无论是平均值还是中位数,专利的NPCN都要比被引频次的分布更为集中、更加聚拢。因此,从平均分布上来看,NPCN对专利被引频次的标准化效果较为明显。
表2   不同学科专利被引频次和NPCN的平均分布情况
学科专利被引频次NPCN
平均值中位数平均值中位数
0128.0811.004.393.42
0223.8211.004.083.02
0317.3810.004.013.07
0414.238.003.562.54
059.225.003.803.16
0617.969.004.123.06
076.715.003.182.69
0828.0012.004.103.02
0917.928.003.872.96
1027.5513.004.253.05
1121.3110.004.293.20
1231.2240.004.783.79
1346.5046.505.755.75
1422.6910.003.812.95
1523.3815.003.432.89
1622.6411.003.492.74
1723.0511.004.043.11
1821.409.003.003.10
1921.3410.003.993.02
2026.1911.004.133.26
2119.847.004.022.97
2212.7513.005.025.15
为了进一步西元红河棋牌 NPCN的标准化效果,笔者还对比了专利被引频次和NPCN的整体分布情况。结合图2和表3可以看出,不同学科的专利在被引频次上差异明显,甚至在同一学科中分布也十分离散。经过标准化处理之后,不同领域的专利NPCN分布更加集中且差异显著减小。从平均分布和整体分布上来看,不同学科的专利NPCN呈现出明显的同分布状态。由此说明,NPCN在标准化不同学科专利的被引频次时有着良好的效果。


图2   不同学科专利被引频次和NPCN的整体分布情况
表3   不同学科专利被引频次和NPCN整体分布标准差
学科专利被引频次标准差NPCN标准差
0173.194.23
0286.384.96
0327.354.04
0420.322.88
0513.862.69
0631.043.86
075.212.08
0849.933.92
0952.564.04
1030.594.34
1138.254.74
1223.804.35
1336.501.25
1430.973.10
1523.521.80
1630.822.06
1740.063.55
1824.271.89
19145.875.26
2048.563.84
2131.953.86
228.230.80
5.3    不同年份专利被引频次标准化后的效果
为了验证NPCN对不同年份专利被引频次的标准化后的效果,笔者仍从平均和整体两个方面观察专利被引频次和NPCN分布情况。表4展示的是不同专利在两种指标上的平均分布情况。由结果可以看出,2005年的专利篇均被引最高为24.04,而2010年发表的专利篇均被引频次最低仅为16.25,前者是后者的1.48倍,而经过标准化处理之后,两者之间的差距降为1.11:1。用中位数来计算不同年份的专利在平均分布上的差距时,也得到相似的结果。
表4   不同年份专利被引频次和NPCN的平均分布情况
发表年份专利被引频次NPCN
平均值中位数平均值中位数
200524.0412.004.223.21
200622.5510.004.093.13
200717.408.003.892.94
200817.668.003.872.93
200917.068.003.792.89
201016.258.003.792.93
另外,笔者西元红河棋牌 了不同专利在被引频次和NPCN的整体分布情况,分布结果见图3。从图3和表6中可以看出,不同年份发表的专利在被引频次上相差很大,而经过标准化处理之后,不同专利在NPCN上的差异减小达到了近似同分布的状态。结合两种分布情况来看,NPCN标准化处理可以使不同的专利实现跨年份比较。


图3   不同年份专利被引频次和NPCN的整体分布情况
表6   不同年份专利被引频次和NPCN整体分布标准差
发表年份专利被引频次标准差NPCN标准差
200524.044.22
200622.554.09
200717.403.89
200817.663.87
200917.063.79
201016.253.79
5.4    不同指标与专利被引频次的相关性西元红河棋牌
该部分旨在西元红河棋牌 比均值法(被引频次/领域篇均被引)、比参考文献法(被引频次/参考专利数)、被引频次的Z score、NPCN指标与专利被引频次的相关性关系。由于数据不符合正态性分布,所以笔者使用Spearman相关系数来做相关性西元红河棋牌 ,根据相关系数进行分类:|r|≥0.8为高度相关,0.5≤|r|<0.8为中度相关,0.3≤|r|<0.5为低度相关,|r|<0.3为基本不相关[45]。由图4可以看出,对于3D打印领域的专利而言,未被标准化的被引频次与比均值法和Z score标准化的结果呈现显著的高度正相关(p=0.99,0.97),与比参考文献法的标准化结果呈现显著的中度相关(p=0.74),与NPCN的相关系数仅为0.43,呈现显著的低度相关。在NPCN和其他标准化指标的相关性西元红河棋牌 方面,图4的结果显示NPCN和其他3种标准化指标呈现正相关关系,但相关程度较低。由此可以说明,比均值法、Z score和比参考文献法标准化结果与被引频次在分布上基本相同,而NPCN与被引频次以及其他3种指标的低相关性说明NPCN既保留专利间的差异,但在分布上又独立于被引频次和其他指标。


图4   不同指标与被引频次的相关性西元红河棋牌 结果
6    结果讨论
目前,我国的科学技术评价改革已经到了关键时刻,专利是技术创新成果的载体,对不同专利的影响力进行合理公平的比较,有助于精准掌握创新态势发展、分配创新资源。笔者构建的NPCN提供了利用向心引用网络对专利被引频次进行标准化的西元红河棋牌 视角。以下将从两个方面来讨论NPCN指标:
一方面,NPCN使用专利本身的预期影响力来代表专利的引用潜力,而不是专利所在领域的平均特征[35]。专利被引频次标准化的效果受到很多因素的影响,其中,引文潜力的选择是影响最大的因素。目前大多数标准化指标的实现需要将专利放到所在的领域内,但这种指标存在一些不合理之处,例如,领域的平均影响力代表的是专利所在领域的平均水平,并不能完全等同于特定专利的引用潜力[46],而且,专利由于学科分类方案的不同可能会被归入不同的学科,选择不同粒度级别的学科分类系统也会对最终的标准化结果产生巨大的影响[8]
另一方面,NPCN在标准化被引频次时同时考虑专利的参考情况和施引情况。专利的参考情况用来测度专利的玉溪西元棋牌 来源[4],施引情况则反映目标专利对其他专利的影响程度[47]。因此,相对于单纯基于被引端或者基于施引端的标准化方法,NPCN不仅可以对专利的被引频次进行标准化处理(见表2、表3和图2、图3),还可以反映专利中的技术复杂性[35]
7    结语
专利的被引频次作为一种衡量专利影响力的外部指标,无论是衡量专利的影响力,还是作为同行评议的辅助,都具有重要的参考作用。但在实际应用时,由于专利被引频次因所属学科、发表年份存在很大的差异,不同的专利往往不能直接比较。因此,对被引频次进行标准化处理,使其可以进行跨学科跨年份的比较是科研评价的现实需要。F. Radicchi等指出理想的标准化指标应使得不同学科、不同年份标准化后的引文实现近似同分布[48]。笔者基于向心引用网络设计NPCN指标,并以Dimensions数据库中3D打印领域2005-2010年期间已获授权的专利为例来验证该指标的有效性。西元红河棋牌正版 结果显示:2005-2010年期间3D打印领域的专利在22个FoR学科中均有涉及,且主要分布在09 Engineering、03 Chemical Sciences、08 Information and Computing Sciences、02 Physical Sciences、11 Medical and Health Sciences、06 Biological Sciences;从专利被引频次和NPCN分布的对比情况来看,不同学科、不同年份的专利在被引频次上差异明显,但经过标准化处理之后,不同专利的NPCN差异明显缩小,分布更加聚拢,呈现出明显的同分布趋势;在相关性方面,较比均值法、Z score和比参考文献法而言,NPCN与专利的被引频次相关程度低。基于以上事实,笔者得出以下结论:本西元红河棋牌正版 提出的NPCN是一种独立于专利被引频次的标准化指标,当采用NPCN指标跨学科、跨年份比较时可以有效消除不同专利在被引频次上的巨大差异,使不同专利的引文呈现出明显的同分布趋势。因此,NPCN在标准化不同学科、不同年份的专利被引频次时效果显著。
本文还存在着一些不足,如仅选择3D打印领域的专利来验证NPCN的有效性。今后,笔者将选取更多的西元红河棋牌正版 领域来考查NPCN对专利的标准化效果。此外,被引频次标准化指标在短时间引文窗口下是不可靠的,因为引文窗口时间过短,专利的被引频次还未达到,但如果引文窗口时间过长则不利于及时评估专利的价值。专利引文的同步序列为解决这一问题带来了思路[49]。因此,未来笔者将借助引文同步序列来改进NPCN,以期实现对专利被引频次及时公平的标准化测度。
[1]
CHENG Y H, KUAN F Y, CHUANG S C, et al. Profitability decided by patent quality? an empirical study of the U.S. semiconductor industry [J]. Scientometrics, 2010, 82(1): 175-183.
[2]
SILVERBERG G, VERSPAGEN B. The size distribution of innovations revisited: an application of extreme value statistics to citation and value measures of patent significance [J]. Journal of econometrics, 2007, 139(2): 318-339.
[3]
KE Q. Technological impact of biomedical research: the role of basicness and novelty [J]. Research policy, 2020, 49(7): 15.
[4]
GAG C, LE BAS C. Uses without too many abuses of patent citations or the simple economics of patent citations as a measure of value and flows of knowledge[J]. Economics of innovation & new technology, 2005, 14(5): 333-338.
[5]
张志辉, 程莹, 刘念才. 线性学科标准化方法的效果优化及其对科研评价结果的影响——以39所"985工程"大学论文质量排名为例 [J]. 情报学报, 2015, 34(3): 300-312.
[6]
LILLQUIST E, GREEN S. The discipline dependence of citation statistics [J]. Scientometrics, 2010, 84(3): 749-762.
[7]
伍军红, 肖宏, 任美亚, 等. PCSI:一种单篇论文被引频次标准化方法[J]. 图书情报工作, 2020, 64(23): 22-30.
[8]
任元秋, 王兴, 郑钦钦. 不同学科分类方案下不同学科标准化方法效果的比较西元红河棋牌正版 [J]. 图书情报工作, 2021, 65(3): 84-92.
[9]
周群, 左文革. 论文被引频次标准化方法西元红河棋牌正版 进展[J]. 情报科学, 2018, 36(2): 171-176 .
[10]
SCHUBERT A, BRAUN T. Cross-field normalization of scientometric indicators [J]. Scientometrics, 1996, 36(3): 311-324.
[11]
BORNMANN L, HAUNSCHILD R. Citation score normalized by cited references (CSNCR): The introduction of a new citation impact indicator [J]. Journal of informetrics, 2016, 10 (3): 875-887.
[12]
BORNMANN L. Towards an ideal method of measuring research performance: some comments to the Opthof and Leydesdorff (2010) paper [J]. Journal of informetrics, 2010, 4(3): 441-443.
[13]
ZITT M, SMALL H. Modifying the journal impact factor by fractional citation weighting: the audience factor[J]. Journal of the American Society for Information Science and Technology, 2008,59(11):1856-1860
[14]
WALTMAN L, ECK N J V. A new methodology for constructing a publication-level classification system of science [J]. Journal of the American Society for Information Science and Technology, 2012, 63(12): 2378-2392.
[15]
WALTMAN L, ECK N, LEEUWEN T, et al. Some modifications to the SNIP journal impact indicator [J]. Journal of informetrics, 2013, 7(2): 272-285.
[16]
NARIN F. Patent bibliometrics [J]. Scientometrics, 1994, 30(1): 147-155.
[17]
万小丽. 专利质量指标中“被引次数”的深度剖析[J]. 情报科学,2014,32(1):68-73.
[18]
VAN ECK N J, WALTMAN L, VAN RAAN A F J, et al. Citation analysis may severely underestimate the impact of clinical research as compared to basic research [J]. Plos one, 2013, 8(4): e62395.
[19]
ADAMS J, GURNEY K, JACKSON L. Calibrating the zoom - a test of Zitt's hypothesis [J]. Scientometrics, 2008, 75(1): 81-95.
[20]
GLNZEL W, SCHUBERT A, CZERWON H J. An item-by-item subject classification of papers published in multidisciplinary and general journals using reference analysis [J], 1999, 44(3): 427-439.
[21]
RONS N. Partition-based field normalization: an approach to highly specialized publication records [J]. Journal of informetrics, 2012, 6(1): 1-10.
[22]
BORNMANN L, MUTZ R, NEUHAUS C, et al. Citation counts for research evaluation: standards of good practice for analyzing bibliometric data and presenting and interpreting results [J]. Ethics in science & environmental politics, 2008, 8(1): 93-102.
[23]
WALTMAN L, ECK N J V. A new methodology for constructing a publication-level classification system of science [J]. Journal of the American Society for Information Science and Technology, 2012, 63(12): 2378-2392.
[24]
KOSTOFF R, MARTINEZ W. Is citation normalization realistic? [J]. Journal of information science, 2005, 31(1): 57-61.
[25]
COLLIANDER C. A novel approach to citation normalization: a similarity-based method for creating reference sets [J]. Journal of the Association for Information Science & Technology, 2015, 66(3): 489-500.
[26]
SCHUBERT A, BRAUN T. Reference standards for citation based assessments[J]. Scientometrics, 1993,26(1):21-35.
[27]
HUTCHINS B I, YUAN X, ANDERSON J M, et al. Relative citation ratio (RCR): a new metric that uses citation rates to measure influence at the article level [J]. Plos biology, 2016, 14(9): e1002541.
[28]
ABRAMO G, D’ANGELO C A. A methodology to compute the territorial productivity of scientists: the case of Italy [J]. Journal of informetrics, 2015, 9(4): 675-685.
[29]
ABRAMO G, D'ANGELO C A. A comparison of university performance scores and ranks by MNCS and FSS [J]. Journal of informetrics, 2016, 10(4): 889-901.
[30]
GARFIELD E, MERTON R K. Citation indexing: its theory and application in science, technology, and humanities[M]. New York:Wiley New York, 1979:84.
[31]
KOSMULSKI M. Successful papers: a new idea in evaluation of scientific output [J]. Journal of informetrics, 2011, 5(3): 481-485.
[32]
SMALL H, SWEENEY E. Clustering the science citation index using co-citations [J]. Scientometrics, 1985, 7(3-6): 391-409.
[33]
WALTMAN L, ECK N. A systematic empirical comparison of different approaches for normalizing citation impact indicators [J]. Journal of informetrics, 2013, 7(4): 833-849.
[34]
ROUSSEAU R. Algebraic structures in the ego article citation network[C/OL]. 13th International Conference of the International Society for Scientometrics and Informetrics, 2011[2022-09-15]. //www.issi-society.org/publications/issi-conference-proceedings/proceedings-of-issi-2011/.
[35]
HU X, ROUSSEAU R, CHEN J. A new approach for measuring the value of patents based on structural indicators for ego patent citation networks [J]. Journal of the American Society for Information Science & Technology, 2012, 63(9): 1834-1842.
[36]
HUANG Y, ZHU D, QIAN Y, et al. A hybrid method to trace technology evolution pathways: a case study of 3D printing [J]. Scientometrics, 2017, 111(1): 185-204.
[37]
HUANG Y, LI R, ZOU F, et al. Technology life cycle analysis: from the dynamic perspective of patent citation networks [J]. Technological forecasting and social change, 2022,181:121760.
[38]
HERZOG C, HOOK D, KONKIEL S. Dimensions: Bringing down barriers between scientometricians and data [J]. Quantitative Science Studies, 2020, 1(9): 1-9.
[39]
SINGH V K, SINGH P, KARMAKAR M, et al. The journal coverage of Web of Science, Scopus and Dimensions: A comparative analysis [J]. Scientometrics, 2021(2), 126(6): 5113-5142.
[40]
WANG X, ZHANG Z. Improving the reliability of short-term citation impact indicators by taking into account the correlation between short- and long-term citation impact [J]. Journal of Informetrics, 2020, 14(2): 101019.
[41]
WANG J. Citation time window choice for research impact evaluation [J]. Scientometrics, 2013, 94(3): 851-872.
[42]
Australian Bureau of Statistics.Australian and New Zealand Standard Research Classification (ANZSRC) [EB/OL]. [2022-06-13]. //www.abs.gov.au/Ausstats/abs@.nsf/Latestproducts/4AE1B46AE2048A28CA25741800044242?opendocument
[43]
Zhang L, Sun B B, Shu F, et al. Comparing paper level classifications across different methods and systems: an investigation of Nature publications [J]. Scientometrics, 2022, 127(12): 7633-7651.
[44]
SIVERTSEN G, ROUSSEAU R, ZHANG L. Measuring scientific contributions with modified fractional counting [J]. Journal of informetrics, 2019, 13(2): 679-694.
[45]
陈斯斯, 刘春丽. 引文归一化指标RCR与FWCI指标,F1000评分的相关性西元红河棋牌正版 [J]. 中国科技期刊西元红河棋牌正版 , 2021, 32(1): 110-117.
[46]
ZHANG L, ROUSSEAU R, SIVERTSEN G. Science deserves to be judged by its contents, not by its wrapping: revisiting Seglen's work on journal impact and research evaluation [J]. Plos one, 2017, 12(3): e0174205.
[47]
WANG J C, CHIANG CH, LIN C. Network structure of innovation: can brokerage or closure predict patent quality? [J]. Scientometrics, 2010, 84(3): 735-748.
[48]
RADICCHI F, CASTELLANO C. A reverse engineering approach to the suppression of citation biases reveals universal properties of Distributions [J]. Plos one, 2012, 7(3): 9.
[49]
胡小君. 基于科技引用网络结构算法的科学计量新方法西元红河棋牌正版 [D]. 杭州:浙江大学, 2012.
pornwimp.com fszsgj.com xxlwjz.com nchcqb.com 657184.com xsdhf.com 1150wavo.com dilmanj.com lbqklj.com
稿件与作者信息
李贤
Li Xian
数据下载、整理和西元红河棋牌 以及论文撰写与修改
博士西元红河棋牌正版 生
杨瑞仙
Yang Ruixian
构思、撰写与修改论文
yrx@zzu.edu.cn
教授,通信作者
本文系国家社会科学基金项目“面向代表作评价的科研论文学术价值测度西元红河棋牌正版 ”(项目编号:21CTQ017)西元红河棋牌正版 成果之一。
pornwimp.com fszsgj.com xxlwjz.com nchcqb.com 657184.com xsdhf.com 1150wavo.com dilmanj.com lbqklj.com
出版历史
出版时间: 2023年2月20日 (版本1
参考文献列表中查看
玉溪西元棋牌 管理论坛
None
pornwimp.com fszsgj.com xxlwjz.com nchcqb.com 657184.com xsdhf.com 1150wavo.com dilmanj.com lbqklj.com