作为科学政策分析工具的文献计量指标

第14卷 第2期文章编号:1004-8308(2002)02-0024-07研究与发展管理Vol.14No.2作为科学政策分析工具的文献计量指标

 ⒇

刘作仪

(武汉大学信息管理学院,湖北武汉 430072)

摘 要:越来越多的西方国家把文献计量指标作为一种科学政策分析的辅助工具。本文在分析文献

计量指标的属性及其在应用中的方法论原理的基础上,着重阐述了文献计量指标在科学政策分析中

的应用范畴和方法,即:科学产出量及其质量的分析;流向分析;科学结构分析。

关键词:科学政策;文献计量指标;工具

中图分类号:G311   文献标识码:A

20世纪,科学技术的迅猛发展及其社会功能的日益强大,使它成为促进一个国家或地区社会经济发展的关键因素。因此,自20世纪80年代以来,发达国家,以及少数发展中国家开始高度重视科学政策的研究与制定。制定科学政策需要广泛地掌握科学活动中的有序信息,据此了解科学活动的全貌。目前,从科学研究的结构和功能考察[1],这些信息应该包括科学领域的结构和发展情况、科学与技术、经济与社会的相互作用、科学研究的绩效以及国际合作与交流情况等。

从传统上讲,科学信息最初是由科学家自身提供的。“科学同行”掌握的专业知识主要与某一领域科学发展动态的评估有关。然而,科学政策的制定常常需要经过加工的、组织化和结构化的信息。例如,从世界范围内考察某个国家或组织在某些学科领域的研究趋势;某个国家与其他国家比较在这些学科领域的“影响力”;国际合作的规模和特征;发展中国家的作用;基础研究和应用研究在新技术开发中的作用;学科结构以及学科之间的相互关系。这些信息一般不能由同行专家提供,因为,同行专家一般只从定性角度评价这些问题。毫无疑问,这些定性的评判对制定科学政策极为重要。即便如此,由于同行评议机制自身带来的“问题”[2],仅仅依靠同行的定性评判作为制定科学政策的依据会引起越来越多的问题,特别是对于面向应用、交叉学科以及具有特殊社会和经济目标的研究。而且,现代科学进步的速度非常迅捷,已呈现出诸多新的特征,科学研究的价值并不总是十分清楚的。因此,在依靠专家开展咨询的同时,需要采用特殊的数学工具评价科学活动的情况,这样,科学指标就进入了评估者的视野。

1 文献计量指标是理想的分析科学活动的指标

我们认为,文献计量指标之所以能成为制定科学政策的一种支持工具,是科学文献本身的属性以及文献计量指标分析方法的科学性这两个因素决定的。

1.1 科学文献本身的属性

⒇收稿日期:2001-12-14。

(—),男,,。

第2期         刘作仪:作为科学政策分析工具的文献计量指标25

科学研究的新发现通常要在科技期刊上发表。一个新学科的标志就是创建一份专业杂志,以满足该学科科学家学术交流的需求。文献能在专业期刊上发表,是科学共同体对作者研究工作的基本肯定。以文献为载体的研究成果,从投稿到发表过程实际上是一个同行评议过程。这个过程对促进科学的发展至关重要,因为,使得科学成为一种建制的东西就在于科学家不仅渴望、而且也被期待其发现或成果提供给同行共同体,由共同体审定他的成果,并且把科学中最珍贵的东西,即把同行们对其成果的承认以一种荣誉状的形式授予他。这一建制决定了科学家既作为信息的提供者,又作为批评者和承认者来参与信息和认识之间的交换[3];同时,也决定了科学文献具有如下属性:①科学文献是科学家发表研究成果和进行交流时最理想的场所;②科学文献几乎是整个科学产出的载体,是科学发展全貌的客观反映;③科学文献是科学共同体对研究工作客观评价的反映,是衡量科研工作质量的重要途径。

1.2 文献计量指标的方法论原理

科学指标是反映科学活动中各种现象在具体条件下和特定过程中数量关系的一种测度单元,它从数量上描述对象及其行为状态特征。由于研究活动的主要成果是知识与思想、研究方法与策略等无形财富,因此,反映这些无形财富的有形实体——科学和工程文献及其数量上的关系,便成为测度科学活动的一种重要指标。

利用科学指标描述科学研究活动时要考虑两个问题:①科学研究的哪些方面可用指标进行描述?②哪些方面是否可以用定量方式进行适当的表述?

根据上述原理,我们把可以利用文献计量指标构建的科学指标分为3种类型:①科学产出的规模和特征;②科学影响的范围和特征;③科学的结构特征。

其中,第一、二类指标是分析研究绩效最重要的指标,第三类指标可用于分析学科领域之间的关系和科学的布局。

从方法论上讲,可把文献计量分析划分为一维分析方法和二维分析方法,用于一维分析方法的指标称为一维指标,用于二维分析方法的指标称为二维指标。一维分析方法以具体文献单元(如出版物数量和专利数量)的直接计算为基础。之所以称为一维分析方法,原因在于该方法一般是基于数字的罗列。在上述三类科学指标中,前两类主要由一维分析方法进行测度。例如,科研产出的规模(或科研生产力)由出版物数量计算;产出的影响(可视为“研究质量”)由特定时期内出版物的引文数量计算。当然,在利用一维指标进行分析时,要区分基础研究和应用研究中的出版物,区分“正规”论文和评论性论文,区分不同研究领域的论文,区分短期影响和长期影响(短期影响一般由论文发表后头3年的引文数量计算),区分被引论文和引用论文的特征等。

二维分析方法以不同出版物中同时出现的特定学术名词(即关键词)和引文为分析对象,即共词和共引分析,通过统计揭示关键词之间、引文之间的联系,所有这些联系可以聚合成理想的结构,从而在二维空间——科学地图中展现出来。

2 文献计量指标在科学政策分析中的应用——范畴与方法

2.1 科学产出量及其质量的分析与评价

科学产出量及其质量分析主要利用一维指标。分析时,可以把对象划分为三个层次:①微观层次,主要指研究者个体、研究小组以及某个研究项目等等;②中观层次,主要指研究机构,如研,;,(

26

域和国际性组织(如欧盟)。研究与发展管理               第14卷

需要指出的是,尽管在分析框架内可以测算研究者个体的产量与质量,但是,文献计量方法并不是测量研究者个体产量的有效方法,因为,不同个体在研究领域、研究方向、研究手段等等方面具有巨大的差异性,因此,必须把这种方法与其他方法结合起来使用才能进行有效量度。目前,这方面分析用得最多的是中观与宏观层次[4,5]。由于中观和宏观层次上的分析方法基本相似,本文仅讨论宏观层次上的分析方法。

科学产出量和质量是一个相对概念,这就决定了分析一般都是在比较框架下进行的。传统上,这种比较包括两个方面:①某个科学领域中,一个国家的论文数量(引文数量)占该领域全球论文总数(引文总数)的份额,这个指标可以粗略衡量国家在不同学科领域的研究力量;②某个科学领域中,一个国家论文引用率与该领域全球论文引用率的比数,这个指标可以粗略评价国家在不同学科领域的研究质量和地位。

但是,这种比较忽略了两个最重要的事实:①科学领域不同,文献引用存在较大的差别,例如,分子生物学和基因领域论文的引用率比材料科学论文的引用率高;②一些小国,尽管它们的论文和引文数量较少,但是在某些领域它们表现出很高的研究水平。

很明显,需要对这两方面的缺陷进行校正。

对于领域差异引起的缺陷,可以采用赋予权重的方法进行校正。例如,假设只存在分子生物学和基因领域、材料科学两个研究领域,并且只有A和B两个国家,它们发表了相同数量的论文,其中,A国的论文集中于材料科学领域,B国的论文集中于分子生物学和基因领域(见表1)。尽管A国在两个领域中每篇文章的被引用次数都比B国高,但是,由于A国的论文主要集中于材料科学领域,而该领域的历史经验和性质表明其文章引用率较低,所以,在进行聚合统计后,A国的科学质量反而显得比B国低。如果用固定权重对两个领域每篇文章的引用次数进行加权平均,权重的选择以国家在每个学科领域的论文数占世界论文总数的比例为宜(本例中的权重为0.5),加权统计后,A国的科学质量优于B国。

表1 赋予权重方法对领域差异的校正

分  类        

生产文章数量学科领域材料科学

分子生物学和基因领域

全部领域

引文数量材料科学

分子生物学和基因领域

全部领域

每篇文章的引文数量材料科学

分子生物学和基因领域

全部领域

加权聚合统计后每篇论文的引文数量 A国[***********]053004.013.04.88.5B国 [1**********] [1**********]003.012.011.27.5全世界[***********]300176003.912.18.08.0

第2期         刘作仪:作为科学政策分析工具的文献计量指标27

对于国家大小引起的差异,可以通过计算各领域相对论文数量和相对引文影响的方法克服之。即:在某个科学领域中,某个国家的论文数量(引文数)占该国总论文数量(总引文数)的份额与该领域中的全球论文数(引文数)占全球总论文数(引文总数)的份额的比较。这个指标可以从学科领域的角度展示比较优势,很明显,如果某领域中一国论文(引文)在该国全部论文(全部引文)的份额大于该领域中各国论文(引文)总数在世界总论文(总引文)的份额,则说明该国在该领域中表现出比较优势,反之,则说明不具备比较优势,需要加强这个领域的研究工作。

2.2 流向分析

科学与技术的发展是研究人员彼此交流知识和合作劳动的结晶,因此,有必要建立指标考察,判断这些交流网络的状况,制定合理的政策以促进科学研究中的交流与合作。

科学交流与合作过程实际上是知识流动的过程,可以用研究人员的流动来分析科学交流与合作的现状,笔者把这种分析称为流向分析,它主要利用指标反映研究者个体、研究机构、研究领域以及研究活动的目标部门之间的关系,例如大学与工业界之间的联系,科学与技术之间的联系,乃至地方政府与国家之间的合作等等。反映这些关系的指标是测度研究人员结合的行为和过程、一个国家合作网络的范围的重要指标。

文献中列举的合著者之间的关系是描述科学各领域合作研究的理想指标,因为,当两个或更多的研究人员联合发表论文时,可以肯定这些作者之间存在知识或社会联系。可见,分解文章作者地址中包含的信息,把这些信息与科学期刊涉及的学科联系起来,就可以观察到科学交流诸多方面的具体特征,识别研究活动最主要的合作者,初步反映知识在国家、地区、工业部门以及研究机构之间的流动情况,揭示国家创新系统的各个部分之间的联系。

(1)国际流向情况。毫无疑问,国际科学交流是知识流动最显著的方式之一。要了解特定时间内一个国家与其他国家科学合作的全貌,首先需要列出该国发表的所有论文,然后,根据作者“地址”域名中的信息,汇编该国与其他国家的合著关系。需要指出的是,在国际合作著文现象中,如何判断不同国家的贡献呢?目前,计算该问题的方式有三种[6,7]。

第一种方法是分解法,是指文章作者来自N个国家,把每个国家的论文计为1/N篇。然而,这种方法只是强调了每个国家参与知识生产,没有考虑作者的相应贡献。

第二种方法是第一作者方法,即统计时,只把论文归入第一作者所在的国家,不考虑其他作者的贡献。但是,第一作者并不总是文章最重要的作者;而且,有时文章第一作者与其对应地址之间没有必然的联系。

第三种方法是重叠法,即把不同国家的合作者所写的论文重复地计为其中每个国家的论文,这意味着统计的论文总数要超过实际总论文数量。与分解法一样,这种方法强调的是每个国家参与知识生产,没有考虑作者的相对贡献。目前,在衡量国家的研究绩效时普遍采用这种方法。

国际流向分析可以帮助政策分析人员考察在某一研究领域中本国的国际地位,了解本国与其他国家合作研究的总体情况,评价国际合作的实施情况,从而明确与不同国家开展合作研究的重点领域,并制定相应的国际合作政策。

(2)国内流向情况。知识不仅仅在国家之间流动,而且也在国内各地区、部门和机构之间流动。正如我们可以从国际的角度研究科学合作那样,判断国内各地区、各部门在科研上的联系,分析科学知识在不同部门的扩散情况,分析科学研究部门与应用部门之间的联系。,

28研究与发展管理               第14卷发展情况进行分析[8],统计分析表明,1981至1991年间,政府、工业界以及大学的合作研究呈较大幅度的增长(见图1),而大学与其他部门(包括工业界和医院)的合作研究也呈较大幅度的增长(见图2)。由此可以推断,在科学政策方面要采取积极有效的措施,消除各部门合作研究中存在的障碍,鼓励各部门之间的合作,尤其是大学与工业界之间的合作,支持合作研究基础设施的建设等等

图1 英国国内各部门合作研究的增长     图2 英国综合性大学与其他部门的合作研究

2.3 基于“科学地图”的科学结构分析

科学是由许多相互关联的活动构成的一个复杂的多相系统。系统地调查这些相互关联的活动形成的关系网络,亦即科学的结构,是科学政策研究的一个重要部分。当今,科研信息量浩如烟海,而且仍呈现出不断增加的趋势,因此,需要用合理、可行的方法对有用数据进行压缩整理。在这方面,用复杂表格列举大量数据的方式并不能直接展示科学活动中已存在的和潜在的相互联系,只能借助于“绘图法”,即绘制“科学地图”的方式解决这个问题。

利用“科学地图”方法对信息整序的优点是多方面的:①“科学地图”不仅把数据转换成了特殊的图解描述,而且,绘制地图过程中也完成了数据的压缩与整理,保留了那些有意义的、本质的信息;②能使大量数据以及它们间的复杂关系可视化,读者可以在较短时间内对数据进行更完全的概括,而且,视觉信息更易于记忆;③地图不仅适合于描述静态结构,而且,时间系列性的地图也能使科学的动态特征可视化,例如,一段时期内研究领域发展中出现的重要变化,或国家、研究组织研究重点的变化。

利用文献计量方法提供的信息可以绘制3种类型的科学地图:共词地图(构建相关关键词的结构)、共引地图(构建相关参考文献的结构)、关键词与引文相结合的地图(关键词与引文相结合而形成的结构)[9]。每一类型都能反映不同层次(范围从科研小组到整个国家或整个科学领域)的科研活动。

(1)共引地图,根据两篇特定文献被其他文献同时引用的次数为基础而构建的地图。由于共引关系来源于文献计量中的引文分析,因此,具有共引特征的文献可能反映了它们在认识上具有相关关系以及社会网络关系。当具有共引关系的文献积聚成大量的系列型的文献时,据此形成的共引图可以反映出有相关关系的“研究群落”,即研究的各个专业领域及其相互关系。但是,共[10]

(2)共词地图,共词分析依赖于词本身的特性,即词语是科学概念的首要载体,含盖了无穷的知识领域。某个术语出现于一系列出版物中,可以初步说明这些出版物在这个术语所表达的意义上形成了网络关系。根据共词出现的频率构建的“共词地图”,可以体现某个科学领域的研究主题及其相互联系。但是,词除了具有描述意图外,还有其他目的,它们表达的意义要依据其出现的环境来理解。

共词地图、共引地图、关键词与引文相结合的地图的绘制遵循同一原理,因此,本文仅讨论共词地图的。绘制共词地图时,首先要在特定科学领域中确定一组有代表性的出版物,从这些出版物中选取所有的关键词(包括标题、摘要中的关键词以及数据库中给定的“控制项”)。根据该领域范围的宽广程度,并视分析工作的实际需要,从全部关键词集合中抽取50至100个最常用的关键词(即出现频率最高的关键词)。对其中的每个词,分别确定同时包含(标题、摘要及控制术语中)这个关键词及其他任何关键词(限于所选择的最常用关键词)的出版物的数量。这样,就可构建一个50×50(或100×100)型的共词矩阵。根据矩阵代数的多元变量数据分析技术,用二维空间体现共词矩阵,由此产生的“地图”显示了研究领域内以词之间关系为基础的结构关系。

科学地图可以作为寻找、识别和分析出版物中反映的科学活动结构的工具,可以指明正在出现的科学领域、正在出现的新的研究活动,有助于我们洞察国家或公司在某个研究领域中的地位。尽管专家的知识背景和观点可以用于描绘地图,但是在描绘地图时数据的积聚并不依赖于专家。因此,可以说地图描绘方法独立于专家个人意见。在研究领域非常广泛而且各不相同的实际情况下,这种做法是非常有利的。但这并不意味着地图可以替代专家的观点。

以上分析表明,文献计量指标的统计与分析能够比较全面、扼要地展示科研活动的发展情况。它们可以测度科学研究活动的某些重要方面,包括研究绩效、知识转移和扩散情况、科学与技术的联系、不同时期科学领域的结构、国际合作等等。这些方面是制定政府科学政策不可缺少的辅助信息。发达国家十分重视文献计量指标在科学政策分析中的应用。30多年前,OECD就开始利用文献计量指标监控国家科学技术系统的变化[12]。但是,知识生产和知识交流本身是一个非常复杂的体系,由于文献计量分析仅仅注重科学研究的结果而忽略研究过程,其分析结果必然伴有不精确性和片面化,因此,在政策分析过程中它仅仅是辅助工具之一。

参 考 文 献

[1] NationalBoardofEmployment,EducationandTraining,UsingBasicResearch:AssessingCon-

nectionbetweenBasicResearchandNationalSocio-economicObjectives,CommissionedReport

(36),PreparedbyTheCentreforResearchPolicy,UniversityofWollongong,March1995。

[2] 吴述尧。同行评议方法论[M]。北京:科学出版社,1996。

[3] [美]理查德·P·萨特米尔著。科研与革命[M]。袁南生等译。湖南:国防科技大学出版社,1989。

10—11。

[4] MartinBR,IrvineJ.AssessingBasicResearch:SomePartialIndicatorsofScientificProgressin

:61-90。RadioAstronomy[J].ResearchPolicy,1983,12

[5] NarinF.EvaluativeBibliometrics:TheUseofPublicationandCitationAnalysisintheEvalua-

tionofScientificActivity[M].WashingtonDC:NationalScienceFoundation,1976。[11]

[6] SchubertA,GlanzelW,BraunT.Scientometricsdata-files:Acomprehensivesetofindicatorson

2,649journalsand96countriesinallmajorfieldsandsubfields,1981-1985[J].Scientometrics,1989,16(1-6):7。

[7] AndersonJ,etal.On-lineApproachestoMeasuringNationalScientificOutput:ACautionary

Tale[J].Scienceandpublicpolicy,1988,15(3):149—161。

[8] DianaHicks,KatzJSylan.Sciencepolicyforahighlycollaborativesciencesystem[J].Science

andPublicPolicy,1996,23(1):39—44。

[9] BraamRR,MoedHF,VanRaanAFJ.Mappingofsciencebycombiningco-citationandword

analysis(I:StructuralAspects;-II:DynamicalAspects)[Z].JournaloftheAmericanSocietyforInformationScience,1991。

[10] SmallH,SweeneyE,GreenleeE.ClusteringtheScienceCitationIndexUsingCo-Citations(II)

[Z].MappingScienceScientometrics,8,321—340。

[11] CallonM,LawJ,RipA,(Eds).MappingtheDynamicsofScienceandTechnology[M].Lon-

don:MacMillanPressLtd,1986。

[12] OECD:Proposaledstandardpracticeforsurveysofresearchandexperimentaldevelopment

(FrascatiManual)[Z].Paris,1994。

:ComputationIndexofLiterature

ToolusedinAnalysisofSciencePolicy

LIUZuo-yi

(SchoolofInformationmanagement,WuhanUniversity,WuhanHubei 430072,China)

:AbstractThecomputationindexofliteraturehasbeenincreasinglyusedasasecondarytoolforana-lyzingsciencepolicyinwesterncountries.Basedonanalyzingtheattributeofcomputationindexofliteratureandthemethodofitsapplication,itdescribestheapplicablecategoryandmethodofthecomputationindexofliteratureusedinanalyzingsciencepolicy,namely,analysisonscienceoutputanditsquality,ontransferorientation,andonsciencearchitecture.

Keywords:sciencepolicy;computationindexofliterature;tool

第14卷 第2期文章编号:1004-8308(2002)02-0024-07研究与发展管理Vol.14No.2作为科学政策分析工具的文献计量指标

 ⒇

刘作仪

(武汉大学信息管理学院,湖北武汉 430072)

摘 要:越来越多的西方国家把文献计量指标作为一种科学政策分析的辅助工具。本文在分析文献

计量指标的属性及其在应用中的方法论原理的基础上,着重阐述了文献计量指标在科学政策分析中

的应用范畴和方法,即:科学产出量及其质量的分析;流向分析;科学结构分析。

关键词:科学政策;文献计量指标;工具

中图分类号:G311   文献标识码:A

20世纪,科学技术的迅猛发展及其社会功能的日益强大,使它成为促进一个国家或地区社会经济发展的关键因素。因此,自20世纪80年代以来,发达国家,以及少数发展中国家开始高度重视科学政策的研究与制定。制定科学政策需要广泛地掌握科学活动中的有序信息,据此了解科学活动的全貌。目前,从科学研究的结构和功能考察[1],这些信息应该包括科学领域的结构和发展情况、科学与技术、经济与社会的相互作用、科学研究的绩效以及国际合作与交流情况等。

从传统上讲,科学信息最初是由科学家自身提供的。“科学同行”掌握的专业知识主要与某一领域科学发展动态的评估有关。然而,科学政策的制定常常需要经过加工的、组织化和结构化的信息。例如,从世界范围内考察某个国家或组织在某些学科领域的研究趋势;某个国家与其他国家比较在这些学科领域的“影响力”;国际合作的规模和特征;发展中国家的作用;基础研究和应用研究在新技术开发中的作用;学科结构以及学科之间的相互关系。这些信息一般不能由同行专家提供,因为,同行专家一般只从定性角度评价这些问题。毫无疑问,这些定性的评判对制定科学政策极为重要。即便如此,由于同行评议机制自身带来的“问题”[2],仅仅依靠同行的定性评判作为制定科学政策的依据会引起越来越多的问题,特别是对于面向应用、交叉学科以及具有特殊社会和经济目标的研究。而且,现代科学进步的速度非常迅捷,已呈现出诸多新的特征,科学研究的价值并不总是十分清楚的。因此,在依靠专家开展咨询的同时,需要采用特殊的数学工具评价科学活动的情况,这样,科学指标就进入了评估者的视野。

1 文献计量指标是理想的分析科学活动的指标

我们认为,文献计量指标之所以能成为制定科学政策的一种支持工具,是科学文献本身的属性以及文献计量指标分析方法的科学性这两个因素决定的。

1.1 科学文献本身的属性

⒇收稿日期:2001-12-14。

(—),男,,。

第2期         刘作仪:作为科学政策分析工具的文献计量指标25

科学研究的新发现通常要在科技期刊上发表。一个新学科的标志就是创建一份专业杂志,以满足该学科科学家学术交流的需求。文献能在专业期刊上发表,是科学共同体对作者研究工作的基本肯定。以文献为载体的研究成果,从投稿到发表过程实际上是一个同行评议过程。这个过程对促进科学的发展至关重要,因为,使得科学成为一种建制的东西就在于科学家不仅渴望、而且也被期待其发现或成果提供给同行共同体,由共同体审定他的成果,并且把科学中最珍贵的东西,即把同行们对其成果的承认以一种荣誉状的形式授予他。这一建制决定了科学家既作为信息的提供者,又作为批评者和承认者来参与信息和认识之间的交换[3];同时,也决定了科学文献具有如下属性:①科学文献是科学家发表研究成果和进行交流时最理想的场所;②科学文献几乎是整个科学产出的载体,是科学发展全貌的客观反映;③科学文献是科学共同体对研究工作客观评价的反映,是衡量科研工作质量的重要途径。

1.2 文献计量指标的方法论原理

科学指标是反映科学活动中各种现象在具体条件下和特定过程中数量关系的一种测度单元,它从数量上描述对象及其行为状态特征。由于研究活动的主要成果是知识与思想、研究方法与策略等无形财富,因此,反映这些无形财富的有形实体——科学和工程文献及其数量上的关系,便成为测度科学活动的一种重要指标。

利用科学指标描述科学研究活动时要考虑两个问题:①科学研究的哪些方面可用指标进行描述?②哪些方面是否可以用定量方式进行适当的表述?

根据上述原理,我们把可以利用文献计量指标构建的科学指标分为3种类型:①科学产出的规模和特征;②科学影响的范围和特征;③科学的结构特征。

其中,第一、二类指标是分析研究绩效最重要的指标,第三类指标可用于分析学科领域之间的关系和科学的布局。

从方法论上讲,可把文献计量分析划分为一维分析方法和二维分析方法,用于一维分析方法的指标称为一维指标,用于二维分析方法的指标称为二维指标。一维分析方法以具体文献单元(如出版物数量和专利数量)的直接计算为基础。之所以称为一维分析方法,原因在于该方法一般是基于数字的罗列。在上述三类科学指标中,前两类主要由一维分析方法进行测度。例如,科研产出的规模(或科研生产力)由出版物数量计算;产出的影响(可视为“研究质量”)由特定时期内出版物的引文数量计算。当然,在利用一维指标进行分析时,要区分基础研究和应用研究中的出版物,区分“正规”论文和评论性论文,区分不同研究领域的论文,区分短期影响和长期影响(短期影响一般由论文发表后头3年的引文数量计算),区分被引论文和引用论文的特征等。

二维分析方法以不同出版物中同时出现的特定学术名词(即关键词)和引文为分析对象,即共词和共引分析,通过统计揭示关键词之间、引文之间的联系,所有这些联系可以聚合成理想的结构,从而在二维空间——科学地图中展现出来。

2 文献计量指标在科学政策分析中的应用——范畴与方法

2.1 科学产出量及其质量的分析与评价

科学产出量及其质量分析主要利用一维指标。分析时,可以把对象划分为三个层次:①微观层次,主要指研究者个体、研究小组以及某个研究项目等等;②中观层次,主要指研究机构,如研,;,(

26

域和国际性组织(如欧盟)。研究与发展管理               第14卷

需要指出的是,尽管在分析框架内可以测算研究者个体的产量与质量,但是,文献计量方法并不是测量研究者个体产量的有效方法,因为,不同个体在研究领域、研究方向、研究手段等等方面具有巨大的差异性,因此,必须把这种方法与其他方法结合起来使用才能进行有效量度。目前,这方面分析用得最多的是中观与宏观层次[4,5]。由于中观和宏观层次上的分析方法基本相似,本文仅讨论宏观层次上的分析方法。

科学产出量和质量是一个相对概念,这就决定了分析一般都是在比较框架下进行的。传统上,这种比较包括两个方面:①某个科学领域中,一个国家的论文数量(引文数量)占该领域全球论文总数(引文总数)的份额,这个指标可以粗略衡量国家在不同学科领域的研究力量;②某个科学领域中,一个国家论文引用率与该领域全球论文引用率的比数,这个指标可以粗略评价国家在不同学科领域的研究质量和地位。

但是,这种比较忽略了两个最重要的事实:①科学领域不同,文献引用存在较大的差别,例如,分子生物学和基因领域论文的引用率比材料科学论文的引用率高;②一些小国,尽管它们的论文和引文数量较少,但是在某些领域它们表现出很高的研究水平。

很明显,需要对这两方面的缺陷进行校正。

对于领域差异引起的缺陷,可以采用赋予权重的方法进行校正。例如,假设只存在分子生物学和基因领域、材料科学两个研究领域,并且只有A和B两个国家,它们发表了相同数量的论文,其中,A国的论文集中于材料科学领域,B国的论文集中于分子生物学和基因领域(见表1)。尽管A国在两个领域中每篇文章的被引用次数都比B国高,但是,由于A国的论文主要集中于材料科学领域,而该领域的历史经验和性质表明其文章引用率较低,所以,在进行聚合统计后,A国的科学质量反而显得比B国低。如果用固定权重对两个领域每篇文章的引用次数进行加权平均,权重的选择以国家在每个学科领域的论文数占世界论文总数的比例为宜(本例中的权重为0.5),加权统计后,A国的科学质量优于B国。

表1 赋予权重方法对领域差异的校正

分  类        

生产文章数量学科领域材料科学

分子生物学和基因领域

全部领域

引文数量材料科学

分子生物学和基因领域

全部领域

每篇文章的引文数量材料科学

分子生物学和基因领域

全部领域

加权聚合统计后每篇论文的引文数量 A国[***********]053004.013.04.88.5B国 [1**********] [1**********]003.012.011.27.5全世界[***********]300176003.912.18.08.0

第2期         刘作仪:作为科学政策分析工具的文献计量指标27

对于国家大小引起的差异,可以通过计算各领域相对论文数量和相对引文影响的方法克服之。即:在某个科学领域中,某个国家的论文数量(引文数)占该国总论文数量(总引文数)的份额与该领域中的全球论文数(引文数)占全球总论文数(引文总数)的份额的比较。这个指标可以从学科领域的角度展示比较优势,很明显,如果某领域中一国论文(引文)在该国全部论文(全部引文)的份额大于该领域中各国论文(引文)总数在世界总论文(总引文)的份额,则说明该国在该领域中表现出比较优势,反之,则说明不具备比较优势,需要加强这个领域的研究工作。

2.2 流向分析

科学与技术的发展是研究人员彼此交流知识和合作劳动的结晶,因此,有必要建立指标考察,判断这些交流网络的状况,制定合理的政策以促进科学研究中的交流与合作。

科学交流与合作过程实际上是知识流动的过程,可以用研究人员的流动来分析科学交流与合作的现状,笔者把这种分析称为流向分析,它主要利用指标反映研究者个体、研究机构、研究领域以及研究活动的目标部门之间的关系,例如大学与工业界之间的联系,科学与技术之间的联系,乃至地方政府与国家之间的合作等等。反映这些关系的指标是测度研究人员结合的行为和过程、一个国家合作网络的范围的重要指标。

文献中列举的合著者之间的关系是描述科学各领域合作研究的理想指标,因为,当两个或更多的研究人员联合发表论文时,可以肯定这些作者之间存在知识或社会联系。可见,分解文章作者地址中包含的信息,把这些信息与科学期刊涉及的学科联系起来,就可以观察到科学交流诸多方面的具体特征,识别研究活动最主要的合作者,初步反映知识在国家、地区、工业部门以及研究机构之间的流动情况,揭示国家创新系统的各个部分之间的联系。

(1)国际流向情况。毫无疑问,国际科学交流是知识流动最显著的方式之一。要了解特定时间内一个国家与其他国家科学合作的全貌,首先需要列出该国发表的所有论文,然后,根据作者“地址”域名中的信息,汇编该国与其他国家的合著关系。需要指出的是,在国际合作著文现象中,如何判断不同国家的贡献呢?目前,计算该问题的方式有三种[6,7]。

第一种方法是分解法,是指文章作者来自N个国家,把每个国家的论文计为1/N篇。然而,这种方法只是强调了每个国家参与知识生产,没有考虑作者的相应贡献。

第二种方法是第一作者方法,即统计时,只把论文归入第一作者所在的国家,不考虑其他作者的贡献。但是,第一作者并不总是文章最重要的作者;而且,有时文章第一作者与其对应地址之间没有必然的联系。

第三种方法是重叠法,即把不同国家的合作者所写的论文重复地计为其中每个国家的论文,这意味着统计的论文总数要超过实际总论文数量。与分解法一样,这种方法强调的是每个国家参与知识生产,没有考虑作者的相对贡献。目前,在衡量国家的研究绩效时普遍采用这种方法。

国际流向分析可以帮助政策分析人员考察在某一研究领域中本国的国际地位,了解本国与其他国家合作研究的总体情况,评价国际合作的实施情况,从而明确与不同国家开展合作研究的重点领域,并制定相应的国际合作政策。

(2)国内流向情况。知识不仅仅在国家之间流动,而且也在国内各地区、部门和机构之间流动。正如我们可以从国际的角度研究科学合作那样,判断国内各地区、各部门在科研上的联系,分析科学知识在不同部门的扩散情况,分析科学研究部门与应用部门之间的联系。,

28研究与发展管理               第14卷发展情况进行分析[8],统计分析表明,1981至1991年间,政府、工业界以及大学的合作研究呈较大幅度的增长(见图1),而大学与其他部门(包括工业界和医院)的合作研究也呈较大幅度的增长(见图2)。由此可以推断,在科学政策方面要采取积极有效的措施,消除各部门合作研究中存在的障碍,鼓励各部门之间的合作,尤其是大学与工业界之间的合作,支持合作研究基础设施的建设等等

图1 英国国内各部门合作研究的增长     图2 英国综合性大学与其他部门的合作研究

2.3 基于“科学地图”的科学结构分析

科学是由许多相互关联的活动构成的一个复杂的多相系统。系统地调查这些相互关联的活动形成的关系网络,亦即科学的结构,是科学政策研究的一个重要部分。当今,科研信息量浩如烟海,而且仍呈现出不断增加的趋势,因此,需要用合理、可行的方法对有用数据进行压缩整理。在这方面,用复杂表格列举大量数据的方式并不能直接展示科学活动中已存在的和潜在的相互联系,只能借助于“绘图法”,即绘制“科学地图”的方式解决这个问题。

利用“科学地图”方法对信息整序的优点是多方面的:①“科学地图”不仅把数据转换成了特殊的图解描述,而且,绘制地图过程中也完成了数据的压缩与整理,保留了那些有意义的、本质的信息;②能使大量数据以及它们间的复杂关系可视化,读者可以在较短时间内对数据进行更完全的概括,而且,视觉信息更易于记忆;③地图不仅适合于描述静态结构,而且,时间系列性的地图也能使科学的动态特征可视化,例如,一段时期内研究领域发展中出现的重要变化,或国家、研究组织研究重点的变化。

利用文献计量方法提供的信息可以绘制3种类型的科学地图:共词地图(构建相关关键词的结构)、共引地图(构建相关参考文献的结构)、关键词与引文相结合的地图(关键词与引文相结合而形成的结构)[9]。每一类型都能反映不同层次(范围从科研小组到整个国家或整个科学领域)的科研活动。

(1)共引地图,根据两篇特定文献被其他文献同时引用的次数为基础而构建的地图。由于共引关系来源于文献计量中的引文分析,因此,具有共引特征的文献可能反映了它们在认识上具有相关关系以及社会网络关系。当具有共引关系的文献积聚成大量的系列型的文献时,据此形成的共引图可以反映出有相关关系的“研究群落”,即研究的各个专业领域及其相互关系。但是,共[10]

(2)共词地图,共词分析依赖于词本身的特性,即词语是科学概念的首要载体,含盖了无穷的知识领域。某个术语出现于一系列出版物中,可以初步说明这些出版物在这个术语所表达的意义上形成了网络关系。根据共词出现的频率构建的“共词地图”,可以体现某个科学领域的研究主题及其相互联系。但是,词除了具有描述意图外,还有其他目的,它们表达的意义要依据其出现的环境来理解。

共词地图、共引地图、关键词与引文相结合的地图的绘制遵循同一原理,因此,本文仅讨论共词地图的。绘制共词地图时,首先要在特定科学领域中确定一组有代表性的出版物,从这些出版物中选取所有的关键词(包括标题、摘要中的关键词以及数据库中给定的“控制项”)。根据该领域范围的宽广程度,并视分析工作的实际需要,从全部关键词集合中抽取50至100个最常用的关键词(即出现频率最高的关键词)。对其中的每个词,分别确定同时包含(标题、摘要及控制术语中)这个关键词及其他任何关键词(限于所选择的最常用关键词)的出版物的数量。这样,就可构建一个50×50(或100×100)型的共词矩阵。根据矩阵代数的多元变量数据分析技术,用二维空间体现共词矩阵,由此产生的“地图”显示了研究领域内以词之间关系为基础的结构关系。

科学地图可以作为寻找、识别和分析出版物中反映的科学活动结构的工具,可以指明正在出现的科学领域、正在出现的新的研究活动,有助于我们洞察国家或公司在某个研究领域中的地位。尽管专家的知识背景和观点可以用于描绘地图,但是在描绘地图时数据的积聚并不依赖于专家。因此,可以说地图描绘方法独立于专家个人意见。在研究领域非常广泛而且各不相同的实际情况下,这种做法是非常有利的。但这并不意味着地图可以替代专家的观点。

以上分析表明,文献计量指标的统计与分析能够比较全面、扼要地展示科研活动的发展情况。它们可以测度科学研究活动的某些重要方面,包括研究绩效、知识转移和扩散情况、科学与技术的联系、不同时期科学领域的结构、国际合作等等。这些方面是制定政府科学政策不可缺少的辅助信息。发达国家十分重视文献计量指标在科学政策分析中的应用。30多年前,OECD就开始利用文献计量指标监控国家科学技术系统的变化[12]。但是,知识生产和知识交流本身是一个非常复杂的体系,由于文献计量分析仅仅注重科学研究的结果而忽略研究过程,其分析结果必然伴有不精确性和片面化,因此,在政策分析过程中它仅仅是辅助工具之一。

参 考 文 献

[1] NationalBoardofEmployment,EducationandTraining,UsingBasicResearch:AssessingCon-

nectionbetweenBasicResearchandNationalSocio-economicObjectives,CommissionedReport

(36),PreparedbyTheCentreforResearchPolicy,UniversityofWollongong,March1995。

[2] 吴述尧。同行评议方法论[M]。北京:科学出版社,1996。

[3] [美]理查德·P·萨特米尔著。科研与革命[M]。袁南生等译。湖南:国防科技大学出版社,1989。

10—11。

[4] MartinBR,IrvineJ.AssessingBasicResearch:SomePartialIndicatorsofScientificProgressin

:61-90。RadioAstronomy[J].ResearchPolicy,1983,12

[5] NarinF.EvaluativeBibliometrics:TheUseofPublicationandCitationAnalysisintheEvalua-

tionofScientificActivity[M].WashingtonDC:NationalScienceFoundation,1976。[11]

[6] SchubertA,GlanzelW,BraunT.Scientometricsdata-files:Acomprehensivesetofindicatorson

2,649journalsand96countriesinallmajorfieldsandsubfields,1981-1985[J].Scientometrics,1989,16(1-6):7。

[7] AndersonJ,etal.On-lineApproachestoMeasuringNationalScientificOutput:ACautionary

Tale[J].Scienceandpublicpolicy,1988,15(3):149—161。

[8] DianaHicks,KatzJSylan.Sciencepolicyforahighlycollaborativesciencesystem[J].Science

andPublicPolicy,1996,23(1):39—44。

[9] BraamRR,MoedHF,VanRaanAFJ.Mappingofsciencebycombiningco-citationandword

analysis(I:StructuralAspects;-II:DynamicalAspects)[Z].JournaloftheAmericanSocietyforInformationScience,1991。

[10] SmallH,SweeneyE,GreenleeE.ClusteringtheScienceCitationIndexUsingCo-Citations(II)

[Z].MappingScienceScientometrics,8,321—340。

[11] CallonM,LawJ,RipA,(Eds).MappingtheDynamicsofScienceandTechnology[M].Lon-

don:MacMillanPressLtd,1986。

[12] OECD:Proposaledstandardpracticeforsurveysofresearchandexperimentaldevelopment

(FrascatiManual)[Z].Paris,1994。

:ComputationIndexofLiterature

ToolusedinAnalysisofSciencePolicy

LIUZuo-yi

(SchoolofInformationmanagement,WuhanUniversity,WuhanHubei 430072,China)

:AbstractThecomputationindexofliteraturehasbeenincreasinglyusedasasecondarytoolforana-lyzingsciencepolicyinwesterncountries.Basedonanalyzingtheattributeofcomputationindexofliteratureandthemethodofitsapplication,itdescribestheapplicablecategoryandmethodofthecomputationindexofliteratureusedinanalyzingsciencepolicy,namely,analysisonscienceoutputanditsquality,ontransferorientation,andonsciencearchitecture.

Keywords:sciencepolicy;computationindexofliterature;tool


相关内容

  • 论替代计量学在图书馆文献服务中的应用_余厚强
  • 第33卷第9期2014年9月 情报杂志 JOURNALOF INTELLIGENCE Vol.33No.9Sep.2014 论替代计量学在图书馆文献服务中的应用 余厚强 (1.武汉大学信息管理学院 摘 要 1 * 邱均平 2 武汉430072:2.武汉大学中国科学评价研究中心武汉430072) 在线 ...

  • 核心期刊与统计源期刊关联与区别
  • 核心期刊与统计源期刊关联与区别 北京大学出版社出版的<中文核心期刊要目总览>(以下简称<总览>)和中国科技信息研究所(ISTIC )出版的<中国科技期刊引证报告>(以下简称<报告>)分别列出的核心期刊表和统计源期刊表是国内作者发表论文应用最广的选刊标准 ...

  • 中文核心期刊与中国科技核心期刊
  • 中文核心期刊与中国科技核心期刊(简称"统计源期刊") 北京大学出版社出版的<中文核心期刊要目总览>(以下简称<总览>)和中国科技信息研究所(ISTIC)出版的<中国科技期刊引证报告>(以下简称<报告>)分别列出的核心期刊表和统计源期 ...

  • 统计分析法与文献计量法在档案学研究中的应用分析
  • 摘要:档案学研究中的统计分析法与文献计量法既相互联系,又存在差异.本文从方法体系.研究对象.适用范围.实施步骤以及两种研究方法在档案学研究中的实际应用等方面对二者进行比较,发现两者的方法体系既相互交叉,又不尽相同.统计分析法的研究对象.适用范围和应用覆盖面都更为广泛,两者的总体研究流程类似,但在具体 ...

  • 护理研究习题及答案
  • 第一章 绪论 (一)本章学习目标 1能说出科学和科学研究的基本概念. 2了解护理研究的范畴和发展趋势. 3说出护理科研中的伦理原则. 4说出知情同意书的基本内容. (二)本章重点.要点 科学和科学研究的基本概念,知情同意书的基本内容. (三)本章练习题或思考题 一.简答题: 1 护理科研中的伦理原则 ...

  • 期刊的级别.规格和专业术语
  • 1.SCI(科学引文索引) Science Citation Index, SCI是由美国科学信息研究所(ISI)1961年创办出版的引文数据库,其覆盖生命科学.临床医学.物理化学.农业.生物.兽医学.工程技术等方面的综合性检索刊物,尤其能反映自然科学研究的学术水平,是目前国际上三大检索系统中最著名 ...

  • 自考 护理学研究历年真题
  • 全国2012年1月高等教育自学考试 护理学研究试题 课程代码:03008 一.单项选择题(本大题共20小题l 每小题1分,共20分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内.错选.多选或未选均无分. 1.研究着重的是( ) A .共性问题 B .个别现象 C ...

  • 护理学研究历年试题及部分答案解析
  • 全国2009年10月自学考试护理学研究试题 一.单项选择题(本大题共20小题,每小题1分,共20分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内.错选.多选或未选均无分. 1.选择研究对象(样本)应服从于( ) A.随机原则 B.研究目 的 C.样本数 D.研究 ...

  • 我国五大数据库引文功能的比较研究
  • 我国五大数据库引文功能的比较研究 摘 要 本文针对国内的五大引文数据库(中国科学引文数据库(CSCD).中国科技论文与引文数据库(CSTPC).中文社会科学引文索引数据库(CSSCI).中国学术期刊全文数据库(CJFD)和中文科技期刊引文数据库(VIP) 从收录数据.检索途径.检索功能.检索结果以及 ...