欢迎来到学术参考网

国外情报学研究生学位论文关键词分布特征分析

发布时间:2016-04-10 09:22

  情报学是以情报(信息)作为基础研究对象的学科,是在信息科学、计算机科学、文献学、管理学等相关学科融合的基础上逐渐发展起来的,具有典型的跨学科性质。在新世纪里,情报学取得了很大的成绩,新技术的重大变革给情报学的发展带来了新的冲击,也使情报学呈现出了强大的生命力和无量的发展前景。

  

  目前,世界很多国家及地区的高校与科研机构都建立了比较完善的情报学教育体系,其中,情报学研究生教育是其高层次教育。而作为衡量研究生教育质量的一个重要方面的研究生学位论文,其研究内容及质量好坏在一定程度上可以折射出情报学研究及情报学研究生教育的发展方向及水平。通过对国外情报学研究生学位论文进行客观地统计与分析,将会对我们了解和借鉴新世纪国外情报学研究生学位论文的发展和趋势有很大的帮助,有助于为我国情报学研究生教育或者学位论文选题规划等提供可参考的现实依据。

  

  1.数据来源

  

  质量较好的情报学博硕士学位论文往往是在研究生导师的指导下开展的研究或者解决情报学领域内比较重要和前沿性的课题。从总体上讲,这类课题的研究内容常常会涉及多个研究主题,而这些研究主题又往往通过关键词全面、准确地反映出来,这些关键词是对论文核心内容和重点的浓缩和提炼。若某些关键词在某一时期的情报学文献(如学位论文)中出现的频次显著高于同一时期的其他关键词的频次,则可以表示频次高的这类关键词所表征的研究主题是该时期情报学可能的研究热点。因此,对关键词进行合理、有效地挖掘,对提高学位论文资源的利用效率有很大的促进作用。

  

  PQDD(ProQuestDigitalDissertations,ProQuest博硕士学位论文数据库)是目前世界上最大的博硕士学位论文文摘数据库以及使用最广泛的学位论文数据库,收录了美国、加拿大、欧洲各国及世界其他国家l000余所大学和科研机构的众多领域的研究生学位论文文摘及索引。PQDD数据库收录论文年代久长,更新速度快,涵盖的相关学科范围广,界面操作简便,检索途径灵活多样,其功能和服务完备,是对国外的博硕士学位论文进行分析的一个非常好的工具。

  

  CALIS连同全国部分高校和图书馆等机构在2002年采购了PQDD数据库的部分资源,来满足国内科、教、研等工作者对国外博硕士学位论文信息的需求,并且一馆订购、多馆受益,参与订购的成员机构通过CALIS镜像站、上海交通大学镜像站和中国科学技术信息研究所镜像站1访问数据库资源。

  

  本文以PQDD数据库中的“subject”分类导航为基础,选择数据库中唯一的情报学类术语“informationsci¬ence”展开检索,总共获得2000—2009年的国外情报学类研究生学位论文944篇,进而从每篇论文的“key¬words”字段抽取所有关键词,再利用Excel数据处理及分析软件对这944篇论文的关键词进行词频分析,即利用关键词在文献中出现的频次高低的关键词词频分析法,来确定研究热点和动向。

  

  虽然PQDD数据库收录的情报学研究生学位论文也不齐全,不能代表新世纪10年来国外情报学研究生学位论文的全部,但它仍有一定的覆盖面和代表性,所以,我们仅在这个样本内进行各项统计和分析。

  

  全部944篇论文出自于美国(768篇)、加拿大(144篇)、南非(8篇)、中国香港(8篇)、英格兰(5篇)、瑞士(2篇)、西班牙(2篇)、芬兰(2篇)、比利时(2篇)、瑞典(1篇)、荷兰(1篇)和日本(1篇)总共12个国家及地区。其中,美国情报学研究生教育或培训机构的论文数占了全部论文数的81.4%,美、加(144篇)两国的论文占了全部论文的96.6%(共882篇)。这一方面反映了该数据库是以北美为主的,另一方面也反映了北美的情报学发展比较成熟,是世界上培养高层次情报学优秀人才的摇篮。因此,本研究所说的“国外”情报学研究生学位论文,实际上主要指的是美国和加拿大两国的情报学研究生论文。需要注意的是,该数据库也收录了我国香港地区大学的情报学研究生学位论文,由此可以窥见香港地区大学的情报学研究生教育更趋向于国外的情报学教育模式。

  

  2.关键词数量分析

  

  关键词标引数量隐含着两个方面的问题:一是论文研究内容的宽泛程度;二是标引深度的合理性。关键词标引数量的多少应当能够保证在检索时保持查全率和查准率之间的某种平衡。标引的关键词数量少,一方面可能是论文的研究内容相对集中,使用少数几个关键词就能够实现对论文内容的概括及提炼;另一方面也可能是关键词标引数量不够,致使对论文内容描述及揭示不够,在这种情况下,如果检索者用词不全面,就会造成查全率的下降。反之,如果论文标引出的关键词数量多,一方面可能是由于论文的研究内容涉及很多个主题,确实需要多个关键词才能够全面、准确地表达出论文的研究思想;另一方面也可能是由于关键词的“滥标”而引起的,作者标引出来的关键词之间存在着意义重复或接近的词甚至是不该用做关键词的却被当成关键词标引“滥标”的结果是检索时的查准率降低。

  

  样本论文944篇总共标引124个关键词,总频次为2511。每篇论文最少标引1个关键词,最多标引7个关键1—9A-2016ChinaAcademicJournalElectronicPu图1中柱状条上面的数字,逗号前的表示标引的关键词数量,逗号后的表示相应的论文数。

  

blob.png

  由图1可以看出,国外情报学研究生学位论文的关键词标引具有以下两个特点:

  

  1) 平均每篇论文标引关键词2.7个(2511频次/944篇),篇均关键词数低于目前国内外科技期刊普遍要求的每篇论文3~8个关键词的标准,这说明存在较大比例的论文标引的关键词数偏少。其原因可能是由于较大比例的论文研究主题相对集中或者标引出来的关键词过少,其结果是论文的被利用率可能因而会受到标引关键词过少的影响。

  

  2) 只标引一个关键词(均为“information science”)的论文有75篇(7.9%),347篇论文(36.7%)标引了2个关键词,386篇论文(40.9%)标引了3个关键词,108篇论文(11.4%)标引了4个关键词,标引了5个、6个关键词的论文分别有17篇(1.8%)和10篇(1.1%),只有1篇论文标出了最多的7个关键词。由上面的数据可以发现,标引1个、2~4个、5~7个关键词论文的比例分别为7.9%、89.1%(其中77.6%的论文是标出2~3个关键词的)、3%,如图2所示。

  

blob.png

  标引关键词数在2~4个的论文占了大部分(841篇,89.1%),这说明在一般情况下,绝大部分的情报学研究生学位论文标引的关键词能够满足对一篇论文主题内容充分揭示的要求,符合论文关键词选取数量的一般规律。论文标引关键词数在5~7个的论文不到论文数的3%。与笔者在另一篇文章《国外图书馆学研究生学位论文关键分析》中所调查的国外图书馆学研究生学位论文关键词的标引数为1~18个不同,情报学研究生学位论文没有出现标引关键词数多达十几个的不合理现象。可以认为,国外情报学研究生学位论文的关键词标引的数量普遍比较合理。

  

  3.关键词频次及关键词分析

  

  某一关键词的出现频次等于附有该关键词的论文数,其出现频次的高低与相关研究成果数量的多少呈正相关的关系,而由频次较高的关键词组成的高频关键词区便形成了情报学研究生学位论文讨论的焦点与热点3,所以,关键词频次分布的集散程度可以表明论文所涉及的研究对象或者研究领域的广泛或集中。表1是2000—2009年944篇

  

                                                                           

 blob.png blob.pngblob.pngblob.png

  文章所有的关键词频次及该频次关键词数量的关系,共有36个关键词频次。为便于分析,笔者按照参考文献4]将关键词频次依频次由低到高排列,将36个频次平均分为4个区,每个区包括9个频次,分别为低频区(1~9频次)、次低频区(10~18频次)、次高频区(19~36频次)及高频区(39~879频次),以此来描述关键词频次与关键词数量之间的关系。表2~表5分别列出了高频区、次高频区、次低频区及低频区所包括的关键词及频次。

  

  为了便于分析,笔者设置各区频次占总频次的百分比,其具体计算方法为:

  

blob.png

  其中,Z表示某区关键词频次占总频次的百分比;Xi表示某区某一频次;I表示某区某一频次对应的关键词数;X'j表示所有频次中某一频次;Y'j表示所有频次中某一频次对应的关键词数;m=36;n=9。

  

  由表1~表5的数据可以看出:

  

  1) 从数量上看,关键词频次范围在1~879次之间,差距比较大。高频区、次高频区、次低频区、低频区的关键词数(频次范围;总频次;各区频次占总频次的百分比)分别为9个(39~879次;1608频次;64.4%)、12个(19~36次;303频次;12.1%)、24个(10~18次;318频次;12.7%)、79个(1~9次;282频次;11.2%)。高频区的关键词数量不多(9个),但频次占了总频次的大多数(64.4%),其他3个区所占比例大体相当(12.1%,12.7%,11.2%),低频区关键词数量较多(79个),但频次所占比例不大。

  

  2) 高频区有9个关键词,依次为信息科学、计算机科学、管理学、大众传播、教育技术、图书馆学、地理信息科学、Web研究、社会研究。

  

  高频区关键词验证了与情报学研究关系最为紧密的领域,其中,信息科学理所当然地是情报学最热门的研究主题,主要代表情报学基础理论研究。计算机科学为情报学提供了现代技术手段和方法,在情报学中应用的重要性不言而喻,有助于情报学的创新性突破。值得注意的是,管理学的出现频率很高,这反映了随着经济全球化的发展,情报学与管理学的关系越来越密切,这与我国近年来情报学的管理学色彩越来越浓厚遥相呼应。在国外,大众传播、教育技术、地理信息科学、Web研究、社会研究与情报学的关系如此密切,非常值得我们关注。图书馆学的出现频次位居前列,这是自然而然的,并不意外。高频区关键词的出现揭示出情报学的核心研究内容。


    3) 次高频区有12 个关键词,依次为公共管理、健康卫生管理、工商管理、地理、高等教育、公共卫生、法律、经济学、市场营销、系统科学、医学、政治科学。其中,公共管理、健康卫生管理、工商管理、市场营销仍然属于管理类,再次证明管理在情报学中的位置越来越重要,“地理”出现在次高频区,与高频区中的地理信息科学共同反映了情报学向地理学的渗透。此外,关键词向高等教育、公共卫生、医学、法律、经济学、政治科学的渗透也比较明显,而系统科学与高频区的信息科学、计算机科学有关,其出现较多说明情报学研究越来越多地运用系统科学的理论与方法,这是必然的。

  

  4) 次低频区有24个关键词,其中,组织行为学仍然与高频区的管理有关;遥感、通信系统、信息技术、人工智能继续与高频区中的信息科学、计算机科学有关;健康科学、护理学也与次高频区的公共卫生、医学有关。特别应该注意的是,认知心理学、社会心理学、教育心理学、行为研究以及文化人类学、种族出现在此低频区,表明情报学也逐渐开始引入这些领域的研究成果。还有关注的一点是,课程设置处于次低频区反映了情报学教育受到一定程度的重视。

  

  5) 低频区有79个关键词,数量最多,次数最少,最为分散,有些词继续与高频区、次高频区有关,例如,与管理有关的包括学校管理、文化资源管理、非营利组织;与教育有关的包括成人教育、社区学院、职业教育、多元文化教育、自然科学教育、双语教育、特殊教育等;与心理学有关的包括职业心理学、临床心理学、发展心理学以及心理学;与社会学有关的包括法医人类学、个体与家庭研究、教育社会学;与研究方法有关的包括数理统计、哲学、运筹学、案例研究、人口统计学。值得注意的是,军事研究、应急服务分别有两篇论文涉及,近年来我国情报学研究也有向这两个方向发展的趋势。更要关注的是,生态学、信息共享、信息管理、知识管理分别只有一篇论文涉及,这非常意外,并与我国情报学研究对这几个领域的热度不减形成了鲜明的对照,特别是在一定程度上反映出国内外对情报学与信息管理、知识管理相互关系的认识和理解上的区别。

  

  4.结论与讨论

  

  通过对PQDD数据库中21世纪前10年国外情报学研究生学位论文标引的关键词数量和频次的统计分析,可以发现,国外情报学研究生学位论文的研究范围广泛,内容全面丰富,涉及情报学的各个分支领域并向纵深发展,初步得出如下结论:


    1)944篇样本论文共标引关键词124个,选题范围与学科视野较为开阔,总频次为2511,频次范围从1~879次,分布极不均衡。按照高频区、次高频区、次低频区、低频区的顺序,其关键词数依次为9,12,24,79;区总频次依次为1608,303,318,282;占总频次比例依次为64.4%,12.1%,12.7%,11.2%。可以认为,频次高、数量少的关键词是该领域最重要的,代表了该领域的研究热点;而频次低、数量多的关键词在该领域中相对不重要,整体上不代表该领域的趋势,但也不能完全排除个别关键词今后可能成为研究热点。

  

  2) 平均每篇文章的关键词频次为2.7次(2511次/944篇),但平均每篇文章不重复的关键词只有0.1个(124个/944篇),这说明一篇文章的各关键词间意义重复或者不同文章间的关键词重复率较高,而后者最为常见。关键词的高重复率反映了研究内容的高重复性,对此现象的解释有两点:一是因为出现了研究热点,因而关键词的重复率较高;二是研究内容的简单重复较多。必须指出,PQDD数据库中收录的样本论文绝大部分是2008年和2009年的,关键词的高重复率反映了2008—2009年的研究热点。对于关键词高重复率的现象,只能在认真研读了论文全文之后,才能得出客观结论。

  

  3) 从国外情报学研究生学位论文中所使用关键词的现状来看,21世纪前10年情报学的研究主流的关键词包括:信息科学、计算机科学、管理学、大众传播、教育技术、图书馆学、地理信息科学、社会研究,这与我国的情况基本一致。计算机科学出现频率很高,信息技术和通信系统出现在次高频区,这说明情报学的确有着很强的技术特征B],而这个技术特征主要体现在信息与通信技术(ICT)在情报学中的应用。我国稍显薄弱的方面是大众传播、教育技术、地理信息科学(系统)、社会研究。结合我国具体国情,今后应当大力加强社会研究(包括人类学、人种学、个体与家庭等)。

  

  4) 与教育学、心理学有关的关键词在国外情报学研究生学位论文中所占的综合比例较大,说明国外情报学研究对这些方面比较重视,可能会成为研究前沿或学科的新的增长点。我国情报学近年来对这方面的研究虽然也不少,但相比之下,在深度和广度上都还存在一定的差距,今后应当奋起直追。

  

  5) 国外情报学研究生学位论文的关键词有向人文科学、社会科学、自然科学、工程科学各个领域渗透和延伸的趋势,以上统计的关键词涉及地理、经济、金融、法律、政治、美术、物理学、地质学、气象学、生物学、医学、衣业、建筑学、城市规划、设计、土木工程、环境科学与工程、工业工程、电气工程、航空航天工程、海洋科学与工程、水资源、生物医学工程、材料工程、矿业工程、化工、能源等诸多学科领域。这表明,情报学研究越来越重视发展与其他众多学科之间的联系,注重与其他学科的交叉与综合。在人类社会,情报无处不在,无时不有,各个领域都离不开情报的运用。因此,情报学应当研究各个领域中的情报运用问题,为各个领域服务。我们过去这样做了,现在也这样做着,国外的经验也证明了这一点,所以我们要沿着这条道路走下去。

  

  6) 在研究方法方面,国外情报学研究生学位论文中的关键词涉及数理统计、哲学、运筹学、案例研究、人口统计学等,这与我国的情况基本一致,反映出国内外的共性。

  

  7) 国外情报学研究生学位论文的关键词涉及军事研究、应急服务等,这与我国的情况不谋而合,特别是竞争情报研究应该更多地引入军事学的理论和方法。只出现一次的关键词,如生态学、信息共享、信息管理、知识管理等,提醒我们应当慎重对待这几个领域与情报学的关系,这在我国可能还存在争议。

  

  从关键词角度来分析某一领域的研究热点及其变化,需要有一个前提,即作者所确定的关键词必须是规范的,能够全面、准确地揭示论文内容的词语。只有这样,运用关键词词频分析法得出的结论才客观、真实和有意义。因此,加强论文作者标引关键词的规范化至关重要。通过关键词词频分析法可以确定研究主题的重点和热点,有助于把握当前的研究现状和未来发展趋势,对于正确把握国外情报学研究生学位论文研究内容的特点及热点有一定的理论意义和参考价值。但是,单纯从关键词出现的频次来判断论文的主题内容就是情报学的研究特点及热点,也有一定的局限性,所以,还需要从其他角度,运用其他方法予以补充和完善,才能作出正确的揭示和判断。

上一篇:293篇医学研究生论文的发表时滞分析

下一篇:嵌入中科院研究生学位论文研究过程的信息素养