欢迎来到学术参考发表网

医药文献信息检索中的医学主题词检索法的创新

发布时间:2015-08-04 09:22

 关键词 MeSH;Emtree;主题词;主题词表;主题词检索法
  中图分类号TP39 文献标识码A 文章编号 1674-6708(2012)80-0211-02
  医学主题词检索法是医药文献作息检索的重要手段,即使信息技术不断发展,在医药文献信息检索领域,主题词检索法都仍在继续使用,并且与时俱进,持续发展。医学主题词表是情报检索语言(通常是主题词语言)的具体体现形式,规范的医学主题词表是二次文献标引的重要依据,根据信息检索原理,标引与检索是信息存储与获取的两个方面,标引从一定程度上决定了信息检索。因此,医学主题词表是用户与标引人员间的“指南”。在医学文献信息检索课程中,医学主题词检索法是医学文献信息的重要方法。PubMed与Embase是医药领域最常用的二次文献检索系统,都包含MEDLINE资源,且都具有医学主题词表,本文以这两个检索系统为例,对医学主题词检索法进行研究。
  1 PubMed与Embase
  根据2012年最新数据表明,PubMed中经过MeSH标引的MEDLINE期刊有5627种,Embase包括MEDLINE在内的期刊有7961种,这些期刊全部经过Emtree标引。PubMed是世界上使用最广泛的免费检索MEDLINE文献的检索系统,它的学科范围包括生物医学和生命科学,覆盖护理学、药学、牙科学、生化学、细胞生物学、卫生保健和兽医学等学科。Embase是全球最大最具权威性的生物医学与药理学文献数据库,包括各种药物和疾病信息,除基础医学和临床医学外,还覆盖如药物研究、药理学、配药学、药剂学、药物副作用、毒物学人体医学(临床与实验)基础生物医学、生物工艺学、生物医学工程与仪器、保健策略与管理、药物经济学、医疗公共政策管理、公共职业与环境卫生、药物依赖性及滥用、精神科学、替代与补充医学、法医学和生物医学工程等学科。
  2 MeSH与Emtree
  医学词表编制的质量决定了对检索系统的检索效率。PubMed系统所用词表为MeSH,Embase系统所用词表为EMTREE,因Embase工作人员参照MeSH于1988年编制了Emtree,这两个著名的医学词表有共同之处,但区别非常明显。对医学词表的比较研究,有益于深入了解检索系统,而且可以加深对情报检索语言的理论研究。
  MeSH与Emtree这两个词表最大的不同是专指度的差异。专指度是指主题词与文献主题概念的切合程度,揭示主题词在表达文献主题的深度和精度方面的能力。词表的专指度直接影响检索系统的查准率,较高专指度的词表能够帮助用户获得更高查准率的检索结果。而专指度的高低与词表的主题词数量直接相关,主题词越多说明词表的专指度越高。如表1所示的收词量上来看,Emtree收录的主题词是MeSH的2.4倍,同义词也多出了七万多条,从这一角度能够反应出利用Emtree检索比利用MeSH检索会获得更高的查准率。
  同一个生物学或医学概念、术语,在两个词表中的地位有较大区别。通常,Emtree使用更多的词语做主题词,而有可能这些词语被MeSH当作入口词来使用,这样MeSH的概念体系可能更加清晰,同时可以防止相关文献在彼此同义或近义的各个词下的分散。但从总词汇量方面来讲,Emtree的词汇数量远远多于MeSH词汇数量,对于用户来讲,更多的词汇意味着易用性更好。而且Emtree针对药物主题词专门设置了17 个核心的药物副主题词和47 种给药途径,如药物副作用反应、临床试验或药物分析等,增强索引的深度。针对疾病主题词专门设置了14个疾病副主题词,包括恢复、副作用、外科手术、治疗等,帮助用户精确地检索疾病的某一类或几类分支的相关文献, 提高相关性。这些在Embase数据库中的文献记录可以清晰地体现,文献被标引时使用的主题词被分成了药物、疾病和其他三种类型。
  3检索效果比较
  本文通过对两个检索系统中主题词扩展检索(即包括被检索词及其所有下位词的检索)进行测试,比较分析其检出量之间的差异,进而评价其检索效率,为教学过程中学员理解和掌握主题词检索法示范,最终为用户选取最佳检索平台提供理论依据和参考。
  3.1常见疾病、药物或研究方向等医药概念检索
  因PubMed与Em转自 第一论文网base的基本检索都具有检索词自动转换或匹配主题词功能,故检索结果也同时对比给出基本检索命中文献数。
  从表2中我们可以看到,常见疾病如心脏病和糖尿病的检索文献命中率Embase都好于PubMed;常见药物使用商品名芬必得,Embase能够通过商品名匹配到主题词布洛芬,命中文献,PubMed几乎不能识别芬必得,只有使用布洛芬才能命中约为Embase五分之一的文献。生物学领域的转基因动物研究,Embase的命中文献数远远少于PubMed,可以推见PubMed的生物学领域的文献较多。而2012年诺贝尔医学奖的研究领域“诱导多功能干细胞”,在Embase中收录的文献数量可观,而PubMed主题词检索的命中文献仅为它的七分之一多。
  3.2专题检索
  例:查找相关病毒性胃肠炎(viral gastroenteritis)的药物经济学(pharmacoeconomics)方面的文献。为查找到较为准确全面的文献,我们尽量使用主题词检索法和关键词词组相结合的方式。经分析与实际操作。PubMed中“病毒性胃肠炎”没有主题词,但上位词“胃肠炎”有主题词,且它有一个“病毒学virology”的副主题词,故检索式为("Gastroenteritis/virology"[Mesh] OR “viral gastroenteritis”) AND pharmacoeconomics,命中文献数为3。为了扩大检索结果范围,使用“病毒性胃肠炎”的上位词“胃肠炎”,检索式为gastroenteritis AND pharmacoeconomics,命中文献数为62。Embase中“病毒性胃肠炎”这一概念有对应的主题词,故检索式非常简单:pharmacoeconomics AND 'viral gastroenteritis',检索效率也高,命中文献数为77条。
  在医药文献信息检索课程中通过对MeSH与Emtree 两个著名医学主题词表的对比分析与研究,并结合PubMed与Embase中的主题词检索途径的实例检索,帮助学员理解医学主题词掌握主题词检索法,并能够通过结合主题词表来判断检索系统优劣,最终达到选择合适的检索系统与检索方法的目的。
  参考文献
  [1]周晓政.EMBASE.com的检索特色[J].图书情报工作,2005,49(5):136-139.
  [2]于双成.逢大欣与李占兵, MEDLARS与EMBASE所用词表的比较研究[J].情报理论与实践, 1996,19(5):38-40.
  [3]顾萍.PubMed与EMBASE.com检索功能对比分析[J].医学信息,2006,19(11):1975-1977.
  [4]杨淑华.EMBASE.com与PubMed检索MEDLINE数据库的比较研究[J].科学时代,2009(1):71,45.

学术参考网:http://www.lw881.com/jsj/js/95346.html

上一篇:电脑多媒体技术在沙盘模型中的应用

下一篇:公安情报分析中的数据挖掘应用研究