科学知识图谱大全(刘则渊科学知识图谱)不要告诉别人
引文分析的相关概念引文分析(citation analysis),是一种对文献引证与被引证关系进行分析的活动和方法,也是包含对引文关系进行分析的
引文分析的相关概念引文分析(citation analysis),是一种对文献引证与被引证关系进行分析的活动和方法,也是包含对引文关系进行分析的原理、方法、应用在内的一门学科引文分析是基于文献间的联系而产生的一种分析方法。
具体来说,文献体系中文献之间并不是孤立的,而是相互联系的文献的相互关系突出地表现在文献的相互引用方面一篇文献在编写过程中一般都需要参考有关文献在文献发表时,作者往往采用尾注或脚注等形式列出其“参考文献”或“引用书目”。
一个“引文”是指一篇参考文献,进行引用的是引用(citing)文献,接受引用的是被引(cited)文献普赖斯在论及引证及被引证关系时提出:每一篇被引文献,对于引证者(文献作者)来说,就是有了一篇参考文献,而对于被引证者来说,则是有了一篇引证文献(引文)。
一篇文献既可以是施引文献,也可以是被引文献我们谈到引文时,可以站在两个角度:一是站在施引文献的角度,那么引文就是其参考文献;二是站在被引文献的角度,引文就是其本身引文是有方向的,施引文献的时间一般比引文要晚,不可能倒过来引用。
文献在被引时,不一定是全部内容被引,因此,可以把一篇文献中被引的部分称为知识单元,那么知识单元就有生产单元和储存单元之分如果文献A中含有使用并描述文献B的书目注释,那么文献A就含有文献B的参考文献,而文献B具有来自文献A的引文。
在上述的过程中,A被称为引用文献,而B被称为被引用文献按照期刊间引用关系的概念—知识生产单元和知识存储单元(Zinkhanand Leigh,1999),我们也称A为知识存储单元,B为知识生产单元(埃格希和鲁索,1992)。
知识从B流向A,如图1所示,意味着引用是个动态的过程
图1 引用过程对应的概念当引文网络中的文献不是很多(少于几百个)时,用一张引文图就可以形象地表达文献之间的引用关系箭头从代表di的一端指向代表dj的一端时,来自某一馆藏的文献就形成一张有向图,这张图就称为“引文图”或“引文网络”(图2)。
图2 引文图利用引文图表达引文关系的一个优点是比较明晰、清楚,引文关系一目了然但是,如果引文图中涉及的文献很多(数百个以上),那么图形就变得相当复杂,很难分析出关系的结构,这是引文图的一个缺点在这种情况下,最好利用矩阵方法来表达关系网络(尹丽春,2006),引文分析方法也真正有了用武之地。
引用过程是单个的、个体的,是慢慢积累起来的,而引文分析的过程包括对引用过程及海量数据的分析引文网络是一个知识生产和传播的复杂系统,个人和单个文献的作用在网络中已经逐步淡化,仅仅依赖于同行评议和单纯地分析个体文献无法真实地反映整个网络的状态。
只有通过数学手段将网络的整体结构绘制出来,人们才可能从全局着手做出全面而正确的判断超大规模引文网络的形成迫切需要科学工作者提出有效的手段对其进行研究(尹丽春,2006)总的来说,引文分析就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、文献、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法(邱均平,2007)。
关于引文分析,有两个概念不得不提首先是凯斯勒在1963年提出了文献耦合(bibliographic coupling)的概念文献耦合是指引证文献通过其参考文献(被引证文献)建立的耦合关系具体来说,如果A和B两篇文献共同引证了一篇或多篇参考文献,或者说它们有一篇或多篇同样的参考文献,则称A和B两篇文献具有引文上的耦合关系。
另一个对应的概念是文献共引(bibliographic co-citation),也称同引、同被引、共被引,是由美国的斯莫尔和俄罗斯的玛莎科娃在1973年分别独立提出来的,就是指两篇或多篇文献同时被后来的一篇或多篇文献所引证,则称这两篇文献(被引证文献)具有“同被引”关系。
图3(a)展示了A、B两个文献同时被文献a引用的状况,图3(b)则展示出A、B两篇文献同时引用文献a的情况
图3 文献的共引与耦合引文分析领域的发展规律通过对引文分析领域发展的研究和梳理,可以看到引文分析领域的发展有以下的规律(1)引文分析成为科学计量学、文献计量学的范式库恩(2003)指出,“常规科学”是指严格根据一种或多种已有科学成就所进行的科学研究,某一科学共同体承认这些成就就是一定时期内进一步开展活动的基础。
研究工作可以明明白白地从一套规则中引出来,但范式却比任何一套这样的规则都要更为优先、更为适合、更加完整“一种成就”构成了范式自从加菲尔德、普赖斯、斯莫尔等的著作出版后,这些著作的成就足以空前地把一批坚定的拥护者吸引过来,使他们不再去进行科学活动中各种形式的竞争。
同时,这种成就又足以毫无限制地为一批重新组合起来的科学工作者留下各种有待解决的问题凡是具备这两个特点的科学成就,此后被库恩称为“规范”在科学计量学、文献计量学领域,引文分析成为科学工作者的主要研究范式科学的新发现或者新发明对于研究者来说并不是刚开始就全部能够被接受的,也需要一个不断适应和成长的过程。
引文分析这个领域的发展也不是一帆风顺的,是不断解答质疑者、不断改进,从而完善和成熟起来的(2)引文分析的发展受到了新技术的促进每个学科的发展都是在吸取其他学科的精华的过程中成长起来的科学与技术也是互相促进的,一个新技术的发展会引起相关科学领域的巨大进步,引文分析领域也不例外。
在引文分析发展的三个时期,第一是加菲尔德吸取了谢泼德的引文的理念和技术,才促成了引文索引法的诞生,弥补了主题索引法的不足,能够更加准确快速地找到研究者所需的文献第二就是计算机技术的大发展为引文分析的可视化提供了很好的土壤和平台,从过去的手工绘图发展为机器绘图。
第三就是互联网的兴起和发展,促进了知识的快速流动,也为海量的数据库提供了可能,为引文分析提供了绝好的网络环境,能够更加及时地发现引用关系同时互联网的出现对引文分析研究从方法和内容上都提出了新的挑战,传统的引文分析能否和网络计量无缝连接,这是对引文分析领域研究者的新考验。
刘则渊等(2008)在《科学知识图谱:方法与应用》一书的导言中,明确指出:“从普赖斯、加菲尔德到斯莫尔,已确立起日臻完备的引文分析理论与方法,构成科学计量学的基础与主流,在一定意义上也可以说在科学计量学中已形成一门成熟的分支学科—引文分析学。
”引文分析学是以文献、信息、科学、技术、网络等领域的引证和被引证关系为对象,以引文之间知识联系与流动过程为基础,运用数学、社会学、心理学、图形学、计算机学等现代方法和手段,研究引文活动的规律及其应用的一门交叉学科。
引文分析学与文献计量学、科学计量学、信息计量学、网络计量学、知识计量学等有密切的关系,其共同基础都是知识流动理论引文过程中的知识流动理论(1)知识流动理论的历史源流波普尔在《客观知识——一个进化论的研究》一书中明确提出科学知识增长图式:“P1→TT→EE→P2”,即“问题→试探性理论→排除错误→新问题”。
科学知识的增长过程,就是各种不同的假说(理论)互相竞争、自然选择的过程,这一过程与生物进化的过程十分相似波普尔区分三个适应层次:遗传适应、适应性行为学习和科学发现他认为一切进化都含有一种基本的承袭结构,它在不同的领域表现为有机体的基因结构、基本行为形式和公认的理论(周超,2004)。
波普尔(2005)的世界3理论主要致力于为世界3的客观性、自主性和实在性作辩护他一再强调,客观知识是由说出、写出、印出的各种陈述组成的,如科学知识是由问题、问题境况、假说、科学理论、论据等组成的客观知识包括思想内容及语言所表述的理论内容,它们出现在杂志、书本、图书馆等一定的环境之中。
知识的客观意义可与蜜蜂酿的蜜相类比人在适应自然界的过程中,获得知识是最主动的,也许甚至比获取食物还主动自然界的任何信息都不会自行从环境中流入人的头脑中,人只有像寻求食物一样主动地探索自然界并从中汲取信息,才能从自然界获得有用的信息。
在波普尔看来,对科学知识积累最有意义的事件是证伪旧理论,而不是证实新理论(赵敦华,2006)库恩提出的科学知识进化的“范式”模式认为科学知识依照“前科学(没有范式)→常规科学(建立范式)→科学革命(范式动摇)→新常规科学(建立新范式)”的知识增长模式或者简单地是按范式→范式的过程进化,与波普尔模式有着不同的侧重点。
他指出了问题(即反常、危机)在知识进化中的航标作用“危机的意义就在于,它可以指示更换工具的时机已经到来”(库恩,2003),危机给科学家带来了批判精神和创造精神,各种竞争的理论层出不穷,经历了百家争鸣的新范式选择后,一切危机都随着新范式的出现及其被接受而宣告结束,从而确立了新的常规科学。
波普尔的模式侧重于从知识创造过程→思维过程的角度讨论科学知识的进化,而库恩模式则主要是从思维结果→科学理论的互相更替来谈科学知识进化的因此,它们之间不应该互相对峙而是互补的实际上,知识本身就隐含了创新的特质,著名的物理学家、科学学创始人之一贝尔纳(1982)曾指出:“科学远远不仅是许多已知的事实、定律和理论的总汇,而是许多新事实、新定律和新理论的继续不断的发见。
它所批评的,以及常常摧毁的东西,同它所建造的东西一样多”由此可见,科学知识的进化是一个对旧的科学观念的否定的过程,它必然导致科学理论的焕然一新,必然要伴随自然观、方法论和思维方式的全面变革迄今,人们对知识进化的研究成果,形成了不同的学说和模式,归纳起来主要有:“证伪主义模式”(拉卡托斯,1986)、“历史主义模式”(施良方,1994)、“研究纲领模式”(拉卡托斯,1986)、“信息加工论”(施良方,1994)、“仿生物进化论”[包括“自然选择论”、“知识基因论”(刘植惠,1999)]等。
这些知识进化学说和模式都是基于文献的知识的进化,或者说这些进化学说和模式的建立都离不开文献(2)引文分析中知识流动的基本观点1)知识进化的显著特征是知识的继承的“遗传”性和发展的“变异”性继承是知识进化发展的基础,发展是知识进化的标志和目的。
显然,这种“继承”和“发展”都离不开对文献的利用(马恒通,2005)文本中的客观知识成为人脑中有用的新知识,即主观知识主观知识再客观化于某一物质载体上,就成为文献,从而进入社会的公共知识、客观知识体系中,使原有文献中的客观知识得到继承和发展,实现了知识的进化(马恒通,2004)。
知识基因、知识DNA、知识细胞和知识体系是知识遗传与变异的结构要素(许志强,1990)变异的知识再客观到某种载体上就进入社会,再经真实性和有用性的检验取得社会承认后,以形成的新的知识形态进入社会知识体系中,从而使社会客观知识得到进化。
总之,人的知识结构对外来的文献知识信息经过吸附、同化、选择、建构,形成知识基因、知识DNA、知识细胞和知识体系,并实现客观化的过程,就是知识的遗传、继承与变异发展运动2)知识的流动实质上是一些思想在不同的知识主体之间的运动,科学技术知识流动的成因是,知识的进化和知识势差、区位势差。
知识的进化是一个自然选择的过程,自然选择的结果就是优胜劣汰只有那些优秀的知识才能流传和保留下来也就是优秀的知识有自身的优越性,即比其他知识有优势,就是知识优势知识优势是在知识流动过程中一条知识链相对于另一条知识链所表现出来的优势。
知识优势包括知识存量优势和知识流量优势知识优势来源于知识链在成员已有知识基础上的知识流动过程中的知识共享和知识创造(张睿鹏,2005)科学技术知识流动会形成聚集和扩散效应科学技术知识流动过程中形成的聚集现象可以用“马太效应”来解释。
聚集就是形成相对固定的知识群,从而形成相对固定的学术共同体,以及一些相对固定的研究者,成为相对固定的学术流派,形成学术研究的范式,有固定的学术领域,成为一门新学科,或者成为经典的文献3)由于知识的载体不同,知识流动会形成不同的网络,主要有知识主体之间的网络、人为主体的网络、团队知识网络、知识与知识之间的网络及多种类型的节点或关系构成的知识网络等(张睿鹏,2005)。
本节的网络主要是知识与知识之间的网络,其节点一般为知识的载体,如作者、期刊、引文等,边为知识之间的引用关系或共引关系等在知识的流动过程中,一个节点既可以是知识的供给者,也可以是知识的接受者随着时间的推移,各个节点所拥有的知识水平也在不断地发生变化,在某一时刻一个节点是另一个节点的知识需求者,在下一时刻很可能这个节点就成为另一节点的知识供给者。
伴随着知识的流动,专有知识完成了向公共知识的转化,隐性知识完成了向显性知识的转化这整个过程是一个动态变化的过程,具体来说,也就是知识公共化和知识显性化的过程(陶勇,2007)4)文献是知识的承载体,引用则是知识发生了流动,引用的过程是文献发生联系的过程。
每篇文献都包含知识,是知识的承载体这个承载体中的知识,既可以从别的文献中来,同时也可能流向别的文献,因此,此文献既能是被引文文献,也能是施引文献在引文分析中,必须分清楚角度,分析一篇文献,既能分析其被引了多少次,也能分析其引用了多少篇文献,不管是引用还是被引,都说明知识发生了流动,都说明其与引用和被引文献都有联系。
也就是说,文献间引用形式上存在的联系,表明文献间在内容上必然存在某种联系即如果文献集合A中的ai引用了文献集合B中的文献bj,则可认为文献ai与文献bj在内容上必然存在联系5)知识流动可以量化既然知识可以流动,那么知识流动了多少?如何计量知识的流入和流出?若引用形式一样,则文献间内容联系的程度一样,对于每种内容间的联系均可定义相应的计量单位。
加菲尔德给出了简单的被引频次的指标被引频次是最简单的指标不管真实知识流动了多少,都按次计算,如果被引频次高,则说明知识流出的多,也说明被引文献的质量比较高普赖斯也提出了点出度、点入度的概念,说明知识流动可以量化。
(参考文献 略)本文摘编自《专利引文分析的理论与实践》,标题和内容有调整科学创造未来,人文温暖世界在科技引领发展的时代,与您共同关注科技史、科技哲学、科技前沿与科学传播,关注人类社会的可持续发展科学人文在线,创造有价值的阅读!
欢迎关注、点赞、留言、转发、参与赠书活动,联系邮箱:houjunlin@mail.sciencep.com。今日图书推荐
本书是国内进行专利引文分析研究的探索之作首先,从引文分析的概念和理论出发,把握知识流动这一共同主线,引申出专利引文分析的基本概念框架,阐释专利引文分析的内在机理某次,从空间和时间两个维度,基于海量数据并利用可视化工具和方法,形象和直观地揭示专利引文活动中知识扩散与演化轨迹。
最后,基于专利引文数据对技术发展的普遍特征和个体特征进行测度与分析本书从理论、方法相应用三个层面展现了专利引文分析的学术内涵和应用前景,真有较强的理论意义和现实价值本书适合从事科学计量和专利计量研究的教师、科研人员和研究生阅读。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186