您好,欢迎来到百家汽车网。
搜索
您的当前位置:首页利用文献计量学研究学科热点初探_张宏梁

利用文献计量学研究学科热点初探_张宏梁

来源:百家汽车网
医学信息学杂志 2008年第11期JOURNALOFMEDCIALINFOMATCIS

#医学信息研究#

利用文献计量学研究学科热点初探

张宏梁 田 玲 张黎黎

(中国医学科学院医学信息研究所 北京100005)

*

1摘要2 文献计量学是信息科学领域中的一个重要分支学科,目前在许多学科的研究中日益得到广泛的应用。利用文献计量学,可以从核心机构、核心作者、高被引文献、关键词等多个方面客观地从宏观的角度来分析总结当前学科研究热点,从而为管理决策人员、学科研究人员等提供学科情报。本文通过一些实例研究,总结了利用文献计量学研究学科热点的途径,并针对目前研究方法的局限性提出了一些改进的措施。

1关键词2 文献计量学 学科研究 热点

PreliminaryStudyonDisciplineHotspotsbyBibliometrics ZhangHongliang,TianLing,ZhangLili1InstituteofMedi-calInformation,ChineseAcademyofMedicalSciences,Beijing100005,China

1Abstract2 Bibliometricsisanimportantsub-disciplineininformationsciences,andisapplyingbroadlyinmanydisciplineresearches1Thecurrentdisciplinehotspotscanbeanalyzedfromthemacroscopicalanglebybibliometric,

fromthe

followingaspects:coreinstitutes,coreauthors,highlycitedpapers,keywords,etc1Toprovidescientificintelligentbasisfordecision-makersandscientists1Thepapersummarizesthemethodsofusingbibliometricstostudydisciplinehotspotsbysomeexamples,andgivessomeamendmentsolutionstoresolvethelimitations1

1Keywords2 Bibliometrics Disciplineresearch Hotspots

1 引言

文献计量学是借助文献的各种特征的数量,采用数学与统计学方法来描述、评价和预测科学技术的现状与发展趋势的图书情报学分支学科。自20世纪60年代以来,该学科在理论与应用方面均取得了长足的进步,目前在许多学科中日益得到广泛的应用,是信息科学领域中的一个重要分支学科,是情报学研究最活跃、发展最迅速的专业领域之一。

目前,国内关于文献计量学的研究主要集中在文献的外部特征的定量统计分析,如期刊的发文量、发文机构、引文分析,某一学科的发文量、发文机

构、发表期刊、所属国家分析等,对文献内部特征,即文献内容的分析还比较少。本文通过一些实例研究,探讨利用文献计量学来研究学科热点的方法,以期为文献计量学在学科研究中的进一步应用提供一定的借鉴作用。

2 利用文献计量学研究学科热点的途径

学科热点的研究在学术研究方面有着重要的意义,它可以为管理决策人员的科学决策提供参考,为学科研究人员确定研究方向和研究内容提供学科情报依据。但学科热点研究也是学术研究的一个难

*

基金项目:级公益性基本科研业务费专项(07R0107):我国基础医学学科发展文献计量分析。

#11#医学信息学杂志 2008年第11期JOURNALOFMEDCIALINFOMATCIS

#医学信息研究#

点。它要求研究人员既要了解整个学科的整体发展状况和各研究方向的研究现状,又要明确学科研究的重点并预测各个方向的发展趋势。目前学科热点的研究主要由学科研究领域内的专家来完成。这些科学家在他们所从事的研究领域有着丰富的经验,并及时跟踪学科研究前沿,能在一定程度上把握学科研究热点。但一个学科的研究内容是庞大的,一般科学家只能在一定程度上了解其所从事的研究及相关研究的热点,并不能全面把握整个学科的研究热点。

利用文献计量学可以客观地从宏观的角度来研究学科热点,采用数学与统计学方法来分析学科发展过程与现状,并结合学科背景预测发展趋势,这能在一定程度上弥补学科研究专家相对片面的缺点。因此,研究学科热点是文献计量学的一个新的应用,文献计量学也是学科热点研究的一个新的方法。结合前人的研究和已有的研究成果,发现目前利用文献计量学研究学科热点主要通过以下几个途径。211 利用核心研究机构研究学科热点

从文献的发文机构对其进行定量分析,可为各科研机构(学校、团体)的科研成就、学术水平、权威性程度或机构间研究水平的差异提供依据。对发文机构的定量分析主要包括发文量和总被引频次两个指标。发文量和总被引频次反映了所研究对象的活跃程度和被认可程度,是文献计量学方面评价所研究对象科研水平的重要指标。

对2002~2006年WebofScience数据库艾滋病文献进行计量分析,见表1、表2,发现美国哈佛大学、加州大学旧金山分校和约翰#霍普金斯大学这3个机构发文量和总被引次数均处于世界前3位,表明这些机构在艾滋病研究方面占有一定优势,特别是哈佛大学,明显领先于其他机构。此外,美国国家疾病预防和控制中心、加州大学洛杉矶分校、国立癌症研究所和华盛顿大学这4个机构发文量和总被引次数均处于世界前10位,也显示了他们在艾滋病研究领域具有很强的实力。因此,这些研究机构近年来发表的论文的研究内容很有可能是目前艾滋病研究领域的热点。进一步分析这些论文的内容#12#和总结这些核心机构近年来的研究内容是研究该研究领域热点的一个重要途径。

2002~2006年WebofScience数据库

表1排名123456710

艾滋病文献发文量居前10位的机构 机构哈佛大学

加州大学旧金山分校约翰#霍普金斯大学国家疾病预防和控制中心加州大学洛杉矶分校国立癌症研究所华盛顿大学德州大学哥伦比亚大学艾默里大学

国别文献量(篇)美国美国美国美国美国美国美国美国美国美国

18441592146211561020970947914814791

2002~2006年WebofScience数据库

表2艾滋病文献被引次数居前10位的机构排名123456710

机构哈佛大学

加州大学旧金山分校约翰#霍普金斯大学国立癌症研究所

国家过敏与感染疾病研究所国家疾病预防和控制中心华盛顿大学

加州大学洛杉矶分校加州大学圣地亚哥分校阿拉巴马大学

国别美国美国美国美国美国美国美国美国美国美国

总被引次数224701598315248131201257198359280922390568032

212 利用核心作者研究学科热点

从文献的作者对其进行定量分析,也是文献计量学的一个重要内容,同样包括发文量和总被引频次两个方面。

对2002~2006年WebofScience数据库艾滋病文献进行计量分析,见表3、表4,发现西班牙卡洛世三世医院的Soriano,V、比利时天主教勒芬大学的DeClercq,E、西班牙巴塞罗那自治大学的Clo-te,tB、法国国家健康与医学研究院的Katlama,C、

医学信息学杂志 2008年第11期JOURNALOFMEDCIALINFOMATCIS

#医学信息研究#

西班牙巴塞罗那大学的Gatel,lJM和加拿大不列颠哥伦比亚大学的Montaner,JSG在发文量和文章总被引次数方面均排名世界前10位,说明他们的研究在国际上处于相对领先地位。此外,美国杜克大学的Montefior,iDC、加州大学旧金山分校的Rich-man,DD、哈佛大学的Letvin,NL和Walker,BD

表3 排名12345578810

作者Soriano,VDeClercq,EClotet,BKatlama,CLazzarin,AGatel,lJMMontaner,JSGNath,AVlahov,DBalzarin,iJ

这4名研究人员虽然发文量没有排名世界前10位,但文章总被引次数居世界第1、2、4、10位,并且文章的平均被引次数超过20次,明显高于其他研究人员,同样值得关注。这些核心作者的相关研究从另一个侧面反映了目前艾滋病防治研究的热点。

2002~2006年WebofScience数据库艾滋病文献发文量居前10位的作者

国别西班牙比利时西班牙法国 意大利西班牙加拿大美国 美国 比利时

机构卡洛世三世医院天主教勒芬大学巴塞罗那自治大学国家健康与医学研究院圣拉斐尔生命健康大学巴塞罗那大学不列颠哥伦比亚大学约翰#霍普金斯大学纽约医学研究院天主教勒芬大学

文献量(篇)

263192159136134134131127127121

表4 排名123456710

作者

2002~2006年WebofScience数据库艾滋病文献被引次数居前10位的作者

国别美国 美国 加拿大美国 西班牙法国 西班牙西班牙比利时美国

机构杜克大学

加州大学旧金山分校不列颠哥伦比亚大学哈佛大学

巴塞罗那自治大学国家健康与医学研究院卡洛世三世医院巴塞罗那大学天主教勒芬大学哈佛大学

文献量(篇)

927213185159136263134192103

总被引次数

27042624342382234123232279216721372100

平均被引次数

291436181816281014171711817161211112014

Montefior,iDCRichman,DDMontaner,JSGLetvin,NLClotet,BKatlama,CSoriano,VGatel,lJMDeClercq,EWalker,BD

总结分析这些核心作者的研究方向,发现艾滋病相关免疫学研究特别是CTL相关研究、艾滋病相关疫苗研究、抗逆转录病毒治疗方面的研究、艾滋病病毒(HIV)与病毒性肝炎共感染研究、HIV相关膜蛋白、辅助受体及其抑制剂方面的研究是大部分作者所关注的,这些应该是目前国际上艾滋病研究的热点。此外,他们的研究还主要涉及HIV感染的干扰素治疗、RNA干扰治疗、小RNA治疗这些

目前常规治疗外的新方法,也是目前艾滋病防治研究的热点。

213 利用高被引文献研究学科热点

引文信息的定量研究对揭示学科或专业研究中的相互关系、客观反映论文的使用价值和期刊的质量、评价个人成就等方面都有着极其重要作用。被引次数较高的一些文献,可以看作是该领域被广泛

#13#医学信息学杂志 2008年第11期JOURNALOFMEDCIALINFOMATCIS

#医学信息研究#

认可、最重要的论文。如1986年5物理杂志B6所发表的关于高温超导体的研究论文虽然只有4页半,但从发表到年底仅几个月的时间被引用的次数就超过了200次,次年被引用次数超过600次。1987年底瑞典皇家学会将该年度的诺贝尔物理奖授予了这篇论文的两位作者

112

究内容,发现研究最多的是关于HIV抗逆转录病毒治疗药物方面的文章,共有14篇,其中的4篇与药物拮抗研究相关。其次是关于APOBEC3G蛋白方面的文章,有8篇。可以看出,如何有效治疗HIV感染和艾滋病是目前科学家研究的重点,包括抗逆转录病毒治疗药物的研究、新治疗方法的研究(RNA干扰、小干扰RNA、DC细胞)、新药物靶点的研究(APOBEC3G蛋白和HIV相关辅助受体及其抑制剂)这些方面;HIV相关疫苗以及HIV与丙肝共感染也是目前国际艾滋病防治研究的热点,见表5。

对2002~2006年WebofScience数据库被引用次数居前100位的艾滋病文献进行分析,其中最高的1篇被引用615次,最低的1篇被引用152次,平均被引24017次。分析这些高被引文献的具体研

表5

研究方向抗逆转录病毒治疗药物APOBEC3G蛋白RNA干扰、小干扰RNA

HIV相关膜蛋白、辅助受体及其抑制剂

2002~2006年艾滋病防治研究领域高被引文献研究方向

高被引文献量(篇)

14877

总被引次数

3396173421811655154311259771148

平均被引次数

2421621618311162361425712187152441328710

特异性CDT细胞(主要是CD4(+)T细胞和CD8(+)T细胞)HIV与丙肝共感染

树突状细胞(dendriticcel,lDC细胞)疫苗

同时,高频引文的同被引聚类分析对于研究学科或某一专题的研究热点也是一种比较有效的方法,为专业人员深入开展本学科的研究提供参考。崔雷等对国际上重要的医学信息学期刊作引文分析,并对高被引论文进行同被引聚类分析,发现目前医学信息学科研重点主要包括4个领域:医学信息学/计算机在临床实践中应用效果的评价分析;计算机系统内知识表达和运算;自然语言处理;电子病案,分类与编码表,概念表达的基础与应用研究

122

征、研究内容之间的内在联系、学术研究的发展脉络与发展方向等。通过对关键词词频的统计分析,有利于某学科研究热点的分析,或某研究的现状估计及发展趋势预测。周鹏等通过对PubMed数据库1996~2006年有关股前外侧皮瓣研究的文献进行计量学研究,发现自2005年来股前外侧皮瓣研究主要集中在游离皮瓣、穿支皮瓣上,其词频累积达到9715%,说明它们是研究的热点,在一定程度上反映了该学科领域发展的热点与趋势

142

。赵。郑华川等对

悦阳对脊索瘤的高频引文进行同被引聚类分析,发现脊索瘤的研究热点主要集中在脊索瘤的临床病理学研究、该病的治疗,包括手术治疗和放疗以及治疗以后的预后和随访调查等5个方面

132

MEDLINE数据库CD44相关文献高频主题词进行共词聚类分析,显示CD44的研究主要集中在代谢、分析、遗传、生理和免疫方面;CD44的研究正处于基础研究阶段,理论研究深入,有待通过CD44结构和功能的研究来指导临床实践215 综合分析

核心研究机构、核心作者、高被引文献和关键词或主题词是利用文献计量学研究学科热点的几个

152

214 利用关键词或主题词分析研究学科热点

关键词是表达文献主题概念的自然语言词汇。一个学术研究领域较长时域内的大量学术研究成果的关键词的集合,可以揭示研究成果的总体内容特#14#。

医学信息学杂志 2008年第11期JOURNALOFMEDCIALINFOMATCIS

#医学信息研究#

途径。综合这些研究结果,再结合学科发展背景,就可以从文献计量学的角度来总结分析出当前学科研究的热点,为学科研究提供参考。

综合对艾滋病文献的计量分析发现:

(1)预

防、治疗HIV感染方面的研究一直是国际研究热点。其中在预防方面,HIV相关疫苗的研发是目前研究的热点,特别是DNA疫苗与重组载体疫苗的研究。在治疗方面,抗逆转录病毒治疗的依从性、药物拮抗是目前研究的热点。(2)目前治疗HIV感染药物新靶点、新技术发展迅速。特别是APOBEC3G蛋白和TRIM5蛋白的发现和其抗HIV功能的阐明为艾滋病治疗提供了可能的新途径,相关研究也成为目前国际艾滋病防治研究的一个热点。HIV融合辅助受体是目前治疗HIV感染新药的另一个热门靶点,包括趋化因子受体CCR4、CCR5、CXCR4等。治疗HIV感染新方法目前主要集中在RNA干扰、小RNA、DC细胞等方面。(3)HIV与病毒性肝炎共感染值得重视。丙型病毒性肝炎病毒(hepatitisCvirus,HCV)与HIV同为RNA病毒,在感染时也极易同时感染,并且丙肝也极难治愈、危害严重。因此,目前HIV共感染研究最多的就是与病毒性肝炎共感染的相关研究。相关药物往往在治疗这两种病毒感染方面都有功效,特别是逆转录酶抑制剂。而在我国,乙型病毒性肝炎病毒(hepatitisBvirus,HBV)感染者人数众多,HIV与HBV共感染的研究也值得我国科学家关注。

研究热点的文献计量学研究是通过检索关键词(/HIV0or/AIDS0or/humanimmunodeficiencyv-irus0or/acquiredimmunedeficiencysyndrome0)得到的,这其中AIDS可能只是作为一个动词出现(Aids),而有些关于HIV特定蛋白的基础研究并没有出现这些关键词。另一方面,数据库收录期刊有一定的标准和倾向,因此所选用的数据库往往并不能收录所研究领域的所有期刊,从而造成一定偏差。312 时间的滞后性

一般研究论文的发表有一定的滞后性,这包括论文写作的时间、论文审稿和修改的时间以及论文刊出的时间等。这段时间少者几个月,多者两三年甚至更长,这给通过文献计量学研究当前学科热点制造了不可避免的困难。313 国内引文数据库匮乏

基于文献计量学的学科热点研究很大一部分是建立在被引用的分析上的,WebofScience的Sc-ienceCitationIndex(SCI)数据库的出现为引文分析建立了基础。但目前引文分析在我国还缺乏运用的基础,缺乏数据量足够大的中文引文基础数据库,这为通过文献计量学研究我国学科热点造成了困难。314 结果的片面性

单从发文量、被引频次、关键词等文献计量学的指标来分析学科热点,有可能造成分析结果的片面性。如某些研究初期,由于对其认识不够充分,有可能造成研究人员盲目跟风的现象,出现文献量、被引频次的/假高峰0。在研究逐渐深入、认识充分之后,文献量等均会出现理性回归。如果正好在/假高峰0阶段对其进行文献计量分析,就会得出片面的结果。

*

*

3 利用文献计量学研究学科热点的局限性

利用文献计量学研究学科热点在一定程度上弥补了学科研究专家相对片面的缺点,但由于文献计量学本身的特点,也造成了一定的局限。311 数据源的局限性

用文献计量学进行学科热点分析的文献是通过人为限定关键词、来源期刊等检索得到的,而部分研究领域并不能用关键词或关键词的组合来检索,或者检索出的文献并不与所研究领域相关,这必定造成这些数据源的不全面和不准确。如关于艾滋病

4 结语

综上可见,利用文献计量学可以客观地从宏观的角度来研究学科热点,这在一定程度上弥补了学科研究专家相对片面的缺点,

(下转第43页)

#15#医学信息学杂志 2008年第11期JOURNALOFMEDCIALINFOMATCIS

#医学信息技术应用#

息:读者推荐文献。(4)相关类目信息:相似文献、相关研究机构、相关文献作者、中图法分类导航。得到广泛应用的KNS510已经利用/知网节0将知识元库、CHKD期刊、学位论文、会议论文和报纸数据库整合成知识网络,有效激活了CHKD系列资源的价值,实现了资源整体增值。同时其浏览功能代替了检索,降低了检索的复杂度,方便用户迅速找到关联信息。

言转换智能化、受控语言关联智能化、规范语言查获智能化、操作应用智能化。

参考文献

1 http://www1ncbi1nlm1nih1gov/sites/entrez1OL212 http://www1chkd1cnki1net1OL21

3 张红梅,王桂清1EBSCO-MEDLINE与PubMed检索之比较1J21中华医学图书情报杂志,2006,15(5):52-5714 许景红1清华同方主题词、分类号智能检索系统医学专业

11 结论

本文从导航、基本检索、主题词检索、检索结果显示等各个角度对PubMed和CHKD进行了全面对照比较,两者皆为具备智能系统的全文数据库,但又各具特色。PubMed数据库标引质量高,检索功能齐全,兼容性较高,文献跨度年限长,已成为该领域的权威检索工具。CHKD是国内发展较快,技术比较成熟的中文全文数据库,因MCI智能系统形成其独有的5大特色:标引和检索智能化、检索语

子系统的特征与功能1J21中华医学图书情报杂志,2005,14(1):51-541

5 齐南1医学文献检索系统PubMed1J21河南大学学报(医学版),2006,25(2):75-761

6 顾萍1PubMed与EMBASE1com检索功能对比分析1J21医学信息,2006,19(11):1975-19771

7 顾萍1PubMed新增功能浅析1J21医学信息学杂志,2007,(3):243-24511修回日期2 2008-03-061作者简介2 朱华玲,硕士。

(上接第15页)是学科热点研究的一个新的方法。但目前还存在一定的局限性,并不能很准确地反映当前学科研究的热点。针对这些局限性,可以考虑通过以下一些途径来改进这一方法。第一,通过阅读所研究领域的综述性论文,改进检索的关键词,选择适当的数据库,提高用于分析的数据源的准确性。第二,增加关于学术会议论文的分析。学术会议论文一般是科学家最新研究成果的体现,能在一定程度上弥补期刊论文时间滞后性的缺陷。第三,进一步完善中国科学引文数据库(CSCD)和中国社会科学引文数据库(CSSCI)的建设,以便为我国文献计量学研究提供更丰富和系统的国内计量素材

162

参考文献

1 迟玉华1科技期刊在知识创新体系中的功能特征1J21中国科技期刊研究,2000,11(1):2-51

2 崔雷,陈东滨1国外医学信息学科研热点的文献计量学分析1J21医学信息学杂志,2007,28(2):97-10213 赵悦阳1国外脊索瘤研究热点的同被引聚类分析1J21医学信息学杂志,2007,28(2):103-1051

4 周鹏,唐茂林1数据库中有关股前外侧皮瓣的文献计量学分析1J21解剖学报,2008,39(2):2-2661

5 郑华川,于晓欧,辛彦1利用共词聚类分析探讨抗原

CD44研究现状1J21中华医学图书情报杂志,2002,11(2):1-31

6 刘国栋,罗长坤,吴培红1科学计量学的研究现状及发展趋势1J21中华医学科研管理杂志,2005,1401

1收稿日期2 2008-03-20

1作者简介2 张宏梁,实习研究员,发表论文10余篇。

l8(3):137-

。第四,咨询所研究领域的学科专家,结合文

献计量学的结果,改进最终的分析结果。

(注:本文是由中国医学科学院医学信息研究所张黎黎负责的级公益性基本科研业务费专项/我国基础医学学科发展文献计量分析0

(07R0107)项目的部分研究成果,

由张宏梁主要负责完成该部分工作。)

#43#

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- baijiahaobaidu.com 版权所有 湘ICP备2023023988号-9

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务