黄晓鹂主编的《医学信息检索与利用》从信息时代医学信息检索与利用的教学实际出发,以信息素养为目标、信息检索为主线,结合案例着重介绍了信息素养、信息检索基础知识、常用中外文期刊文献数据库检索、网络信息资源检索、特种文献检索、循证医学及证据检索、引文数据库检索、医学信息调研、医学论文写作等内容。本教材课程目标明确,内容系统,案例分析透彻,实用性强,重点突出了医学信息素养、检索方法以及医学信息利用的知识。
前言 绪论 第1节 信息素养 第2节 医学信息素养教育 第1章 信息检索基础知识 第1节 信息资源与信息检索 第2节 信息检索系统 第3节 信息检索技术 第2章 常用书目型期刊文献数据库 第1节 中国生物医学文献服务系统 第2节 MEDLINE/PubMed 第3节 WebofKnowledge 第4节 EMBASE 第3章 常用全文型期刊文献数据库 第1节 中国学术文献网络出版总库 第2节 维普期刊资源整合服务平台 第3节 万方数据知识服务平台 第4节 SciVee ScienceDirect 第5节 Ovid Full Text 第6节 SpringerLink 第7节 EBSCOhost外文全文数据库 第8节 其他外文全文数据库 第4章 引文数据库 第1节 概述 第2节 国内引文数据库检索 第3节 国外引文数据库检索 第5章 特种文献检索 第1节 学位论文检索 第2节 会议文献检索 第3节 专利文献检索 第4节 标准文献检索 第6章 网络信息资源检索 第1节 概述 第2节 网络信息检索工具 第3节 网络免费信息资源 第7章 循证医学及证据检索 第1节 概述 第2节 循证医学研究证据来源 第3节 循证医学研究证据检索 第8章 数字图书馆 第1节 概述 第2节 超星数字图书馆 第3节 方正阿帕比数字图书馆 第4节 美星外文数字图书馆 第9章 信息共享与知识产权 第1节 知识产权概述 第2节 著作权 第3节 专利法 第4节 信息资源共享与知识产权保护 第10章 医学信息管理与利用 第1节 检索策略制定与全文获取 第2节 医学信息分析与研究 第3节 个人文献管理软件 第4节 信息利用与表达 主要参考文献 附录 附录1 《中国图书馆分类法》简表 附录2 主题词及副主题词等级表 附录3 常用名词中英文对照表 附录4 常用网址
第1章 信息检索基础知识
第1节 信息资源与信息检索
一、信息
案例1-1-1
某医学生在上网和阅读书刊时频频看到"信息"、"信息资源"、"信息资源共享"等词语,感到在当
今这个知识经济、科技创新的时代,信息给人类社会带来了巨大变化。什么是信息?信息如何进行
分类?信息具有哪些重要特征?带着这些问题他来到图书馆进行咨询。
问题:
1.信息的概念是什么?
2.信息是如何进行分类的?
3.信息具有哪些重要特征?
分析:
1.信息是许多学科广泛使用的概念,在不同的学科领域有着不同角度的解释。在信息检索领
域,一般将信息理解为关于现实世界事物存在的方式或运动状态的反映。
2.由于不同的事物具有不同的运动状态和运动方式,因而会产生不同的信息反映。从不同的
研究和利用角度可以对信息进行多种方式的分类。按信息的属性划分有:①文字信息;②图像信息;
③数值数据信息;④语音信息。
3.信息有许多重要的特征,这些特征源于信息的基本属性。包括:①客观性;②可知性;③传递
性;④无限性;⑤时效性。
(一)信息的概念
我国国家标准《情报与文献工作词汇基本术语》(GB4894-85)中将信息定义为:"信息是物质存在的
一种方式、形态或运动状态,是事物的一种普遍属性,一般指数据、信息中包含的意义,可以使消息中所描
述事件的不定性减少。"一般认为,信息的含义有广义和狭义之分。广义的信息是对各种事物的存在方
式、运动状态和相互联系特征的一种表达和陈述,是自然界、人类社会和人类思维活动普遍存在的一切物
质和事物的属性。狭义的信息是指具有新内容或新知识的消息,即对接受者来说预先不知道的报道。
信息是许多学科广泛使用的概念,在不同的学科领域有着不同角度的解释。在信息检索领域,一般将
信息理解为关于现实世界事物存在的方式或运动状态的反映。信息有许多重要的特征,这些特征构成了信
息的最重要的自然属性。作为信息的社会属性,信息已成为各行各业不可缺少的重要资源之一。人类获取、
积累并利用信息是认识和改造客观世界的必然过程。借助信息人类才能获得知识,才能有效地组织各种社会
活动。因此,信息是人类维持正常活动不可缺少的资源,与能源、材料并列,构成现代社会的三大支柱。
所谓医学信息,就是用语言、文字、符号、图像及影视数据等反映人类与疾病做斗争的过程中疾病运
动状态及其变化方式的信息。
(二)信息的分类
信息普遍存在于自然界、人类社会以及人脑的思维活动中。由于不同的事物具有不同的运动状态和运动方
式,因而会产生不同的信息反映。从不同的研究和利用角度可以对信息进行多种方式的分类。按信息的属性划分有:
1.文字信息 文字是人们为实现信息交流、通信联系所创造的一种约定的象形符号。广义的文字
还包括各种编码,如ASCII码、计算机中的二进制数字编码等。
2.图像信息 图像是一种视觉信息,它比文字信息直接,易于理解。人工创造的图像,如一幅画、一
张图片、一部电影,大自然的客观景象等都是抽象或间接的图像信息。随着多媒体技术的发展,各类图像
信息库将会极大地丰富人类生活。
3.数值数据信息 数值数据是"信息的数字形式"或"数字化的信息形式"。狭义的数据是指有一定
数值特性的信息,如统计数据、测量数据以及计算机中区别于程序的计算数据。广义的数据是指计算机
网络中存储、处理、传播的二进制数字编码。文字信息、图像信息、语音信息以及自然界直接采集的各种
自然信息均可转换为二进制数码,网络中的数据通信、数据处理和数据库等就是广义的数值数据信息。
4.语音信息 人讲话实际上是大脑的某种编码形式的信息转换成语音信息的输出,是一种最普遍
的信息表现形式。音乐也是一种语音信息形式,是一种特殊的声音信息,它是通过演奏方式表达出来的
丰富多彩的信息内容。
(三)信息的特征
信息的产生、传递、接收,是自然界和人类社会一种极为普遍的现象。人类正是通过对丰富多彩的信
息的捕捉、感受、提炼、加工,来逐渐认识奇妙的大千世界。之所以如此,源于信息的基本属性。
1.客观性 信息是客观事物普遍性的一种表征,而客观事物的物质客观性决定了表征其存在的信
息的客观性。
2.可知性 信息作为客观事物的反映,可被人类通过不同方式、不同方法、不同手段所感知和认识。
信息是人类认识世界的基础与前提。
3.传递性 经人类感知(捕捉、获取)的信息,可以以各种方式、借助于各种载体或媒介广泛传递,为
更多的人所接受。
4.无限性 信息是一种取之不尽、用之不竭的资源。绝大多数信息在应用过程中,可以不断得到扩
充。信息的无限性即为信息的可扩充性。
5.时效性 信息的价值与作用是体现在一定的时空范围之内的,它不但取决于信息的内容本身,还
取决于该信息是否能被人们及时获得。信息只有在得到及时利用的情况下才会有理想的使用价值。
二、信息资源
案例1-1-2
某药理学专业研究生报考的导师的研究方向为"钠泵的分子药理学"。入学初,他想利用学校图
书馆的资源了解一下该领域的研究现状,为确定研究课题做准备。面对不同类型的信息资源,
应该怎样进行选择?如何利用计算机检索呢?
问题:
1.什么是信息资源,信息资源是如何划分类型的?
2.什么是一次文献、二次文献、三次文献?
3.在利用计算机检索系统查找文献过程中,应如何查找相关文献?
分析:
1.信息资源是人类在认识世界与改造世界过程中所产生、整理和记录的有用信息的集合。根
据不同的划分标准,可将信息资源划分为不同的类型。
2.按信息内容的加工级次划分,可分为一次文献、二次文献、三次文献。一次文献是作者以其
本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作。二次文献又称检
索工具,是将大量无序、分散的一次文献收集、整理、加工、著录其特征如著者、篇名、分类、主题、出处
等,并按一定的顺序加以排列,形成供读者检索一次文献线索的新的文献形式。三次文献是科技人
员围绕某一专题,借助于二次文献,在充分研究与利用大量一次文献的基础上,经过阅读、分析、归
纳、概括,撰写而成的新的文献,或综述已取得的成果进展,或加以评论、或预测发展趋势。
3.查找相关文献时,要根据计算机检索系统的检索原理,对检索课题加以分析,明确检索
范围,弄清主题概念,然后选用特定检索语言来表达主题概念,进行信息检索。同时涉及该主题概念
的同义词、近义词要考虑周全,以防漏检。
(一)信息资源的概念
信息资源是人类在认识世界与改造世界过程中所产生、整理和记录的有用信息的集合。该概念有三
层含义:①信息资源是信息的集合。一条或几条信息构不成信息资源。只有当信息达到一定的丰度和凝
聚度,才能成为信息资源。因此,信息资源是多种多样的信息的总和或集合。②信息资源是经过人类选
择的、对人类有用或能满足人类需求的那部分信息的总和或集合。有用性是一切资源的本质属性,信息
资源也不例外。③信息资源是经过人类组织序化的信息的集合。与非信息资源相比,信息资源最显著的
特征就是有序性。无序的信息不仅无法利用,还会造成信息通道的"堵塞",而没有控制的、未经组织的信
息将不能成为资源。
总之,信息资源是经过人类选取、组织、序化的有用信息的集合。
(二)信息资源的类型
人们认识事物往往是从区分事物开始,即比较和分类。而比较和分类的前提就是标准(分析事物的
角度或维度)的选择与确立。对信息资源的认识及类型的划分也是如此。这种认识和划分的目的是借此
深化对信息资源本质及规律的理解和认识。
因此,根据不同的划分标准,可将信息资源区分为不同的类型:
1.按载体形式划分
(1)印刷型:印刷型信息资源是以纸质材料为载体,以印刷(包括手写)为记录手段而生产的一种文
献信息资源,如图书、期刊等。这类信息资源便于直接阅读,符合传统阅读习惯,因此成为人们信息交流
和知识传递的最重要、最常用的媒介。但缺点是存储密度小、占用空间大,不宜长期保存。
(2)缩微型:缩微型信息资源是一种以感光材料为载体,利用光学记录技术形成的文献类型,包括缩
微胶卷、缩微胶片、计算机存取载体的输出胶片(computeroutputmicrofilm,COM)等。缩微型信息资源
具有载体体积小、存储密度高、成本低廉、便于保存等优点。阅读时需借助缩微阅读机或阅读复印机。
(3)视听型:视听型信息资源是一种以磁性材料和光学材料为载体的信息资源。视听型信息资源是
借助特殊的机械装置,直接记录声音信息或图像信息而产生的一种文献。如录音带、录像带、计算机磁盘
等。其特点是可闻其声,见其形,容易理解,便于掌握,有很强的存储能力并能长期保存。
(4)电子型:电子型信息资源是一种采用电子手段并以数字形式存储、利用计算机及现代通讯方式
提供信息的一种新型信息资源,如光盘数据库、网络数据库、电子图书、电子期刊及电子地图等。电子出
版物的问世是信息时代的重要标志,改变了传统书刊的物理形态,开辟了一种新的信息传播渠道,极大提
高了信息的传递速度,加快了社会信息化的进程。与传统信息资源相比,其优点是信息容量大,传递速度
快,便于检索且效率高。
2.按出版形式划分
(1)图书:图书是品种最多、数量较大、范围最广的常见出版物,内容一般比较成熟稳定,目的性和针
对性强,是系统掌握各学科知识的基本文献信息资源。图书除了记录有知识信息这一本质特征外,联合
国教科文组织(UnitedNationsEducational,ScientificandCulturalOrganization,UNESCO)对篇幅(除
封面外)不少于49页的非定期出版物称为图书,以示与期刊等连续出版物的区别。图书一般分为两大
类:一类是提供读者阅读的著作书籍,包括专著、教科书、单卷书、多卷书、丛书等;另一类是提供读者检索
查阅的工具书,包括检索工具书和参考工具书两大类。
每一种正式出版的图书版权页或其他明显部位都标有一个由13位数字组成的国际标准书号
(internationalstandardbooknumber,ISBN),前三位数字代表图书,中间9个数字分为三组,分别表示组
号、出版社号和书序号,一个数字是校验码,如:ISBN978-7-117-13475-0/R?13476(《医学信息检
索――中英文双语教材》)。这是一种国际通用的出版物代号,代表某种特定图书的某一版本,具有
性和专指性。
(2)期刊:期刊也称杂志,是一种采用固定刊名,定期或不定期出版的连续出版物。有统一的版式和
外观,使用年、卷、期连续编号,每期可刊载多个著者的多篇文章。期刊作为一种大众传播媒介,具有出版
周期短、报道速度快、信息量大、内容新颖等特点,是一种利用率很高的文献信息资源。期刊按内容可分
为学术性、科普性、动态性、检索性、娱乐性等类型。医学期刊是科技期刊中的一种类型,刊载能反映医学
学科领域近期的理论、方法、技能等的论文、综述、病例报告等各种文献信息,是医学科学研究原始创作的
首次记录。每一种期刊均有一个由8位数字组成的国际标准连续出版物号(internationalstandardserial
number,ISSN),例如:ISSN0578-1426(中华内科杂志)。ISSN同样具有性和专指性,因而成为读者
查询某种刊物的一个检索途径。
ISBN和ISSN常被用做区分正式或非正式出版物的判断标准。
(3)特种文献:特种文献是出版形式比较特殊的文献的总称,又称非书非刊资料,包括科技报告、会
议文献、专利文献、标准文献、学位论文、档案资料和产品资料等。这类文献信息具有形式独特、数量庞
大、出版分散、知识新、价值高等特点,并有一定的保密性。这些文献一般不公开出版,普通图书馆也不收
藏。但是,特种文献反映的有许多涉及了近期的研究和技术以及国家的法规、标准定义等信息,也是医学
科研的重要信息源。
3.按信息内容的加工级次划分
(1)一次文献:一次文献是指作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素
材写成的原始创作,主要包括专著、期刊论文、科技报告及学位论文等。一次文献所记录的是作者的近期
发现或发明,以及新的见解、新的理论、新的方法等新颖、具体而详尽的知识,因而成为科学研究等工作的
最主要的信息源,尤其是科技论文,已成为科技文献的主体。但由于其量大、分散而无序,给读者的查找
与利用带来了极大的不便。
案例1-1-2中,该研究生的课题已经确立,在课题研究过程中所需的文献资料多为涉及细节的问题,
而一次文献是作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作,
对研究过程进行了细致的记录,报道了新技术、新发明、新知识和新观点,可为该研究生的课题研究
过程提供参考。
(2)二次文献:二次文献又称检索工具,是将大量无序、分散的一次文献收集、整理、加工、著录其特
征,如著者、篇名、分类、主题、出处等,并按一定的顺序加以排列,形成供读者检索一次文献线索的新的文
献形式,包括索引、文摘、目录及相应的数据库。二次文献因其具有检索功能而被称为检索工具或检索系
统。目前,网上的Yahoo、Google等主题指南、搜索引擎,是数据库与网页的信息集合,其功能作用等同
于上述二次文献,所以称其为网络检索工具,指提供网上信息资源检索和导航服务的专门站点或服务器。
它同样是对采集到的网上信息进行加工整理,建立起存储和管理网络信息的索引数据库,为用户提供网
络信息检索导引。
二次文献其主要功能是揭示和报道一次文献,提供查找一次文献的线索,帮助人们在较短的时间内
获得大量的文献信息。作为检索工具,二次文献具有简明性、浓缩性、汇集性和系统性,是文献检索的主
体。随着网络技术的飞速发展,二次文献数据库通过各种网络的链接方式与全文数据库链接,大大完善
了二次文献数据库。也有很多二次文献数据库发展形成了知识网络的整合平台。
(3)三次文献:三次文献是科技人员围绕某一专题,借助于二次文献,在充分研究与利用大量一次文
献的基础上,经过阅读、分析、归纳、概括、撰写而成的新的文献,或综述已取得的成果进展,或加以评论、
或预测发展趋势。这类文献主要包括综述、述评、进展、预测等,各类词典、手册、年鉴、百科全书、指南等
参考工具书也都属于三次文献的范畴。许多学术期刊上均设置有综述栏目,专门刊载三次文献的综述性
期刊也越来越多。
与一次文献产生所不同的是,三次文献是以现有一次文献中的知识信息为基本研究素材,对其进
一步加工、整理、重组,使之成为更加有序化的知识产品。三次文献具有信息含量大、综合性强和参考
价值大等特点。通过阅读某一专题的三次文献,就能比较地了解该专题当前的研究水平与研究
动态。正是由于三次文献的这些特点,案例1-1-2中,该研究生在入学之初应该选择这类文献进行阅
读,使其不必花费时间阅读大量的一次文献,就可以了解某一专题、某一领域当前的研究现状、水
平和动态。
(4)零次文献:零次文献是指未经信息加工,直接记录在载体上的原始信息,如实验数据、观测记录、
调查材料等。这些未融入正式交流渠道的信息,反映的是研究工作取得的近期发现,或遇到的近期问题,
或对某些问题的近期想法等。零次文献是启发科研人员的思路、形成创造性思维的思维素材。
从一次文献到二次文献、三次文献,是一个由分散到集中、由无序到有序的过程。一次文献是检索的
对象;二次文献是存储文献、报道文献和检索文献的工具,是查找原始文献的线索,但不能代替原始文献;
三次文献是信息调研的结果,是经过集中和浓缩的文献,虽然为使用文献提供了方便,但要了解情
况,还要使用一次文献。二、三次文献是根据人们对文献的不同需要,从不同的角度对一次文献进行加工
的产物,其目的是将一次文献的知识内容迅速传送给用户。
不同级次的文献的性质和用途是不同的,可根据不同的需要及条件选择使用。如要了解某一课题当
前近期动态或系统地学习一门知识、技术、可着重阅读近期期刊、消息性刊物、专门会议报道等原始文献;
要收集专题文献或查找有关文献的线索,可利用目录、索引及文摘刊物等二次文献查找,也可阅读相关学
科专家的综述、述评、进展等文献。
(三)信息资源的特征
信息资源是可利用的信息,它具有除"无限性"之外信息的所有性质。相对于其他非资源型信息,信
息资源具有以下4个明显的特征。
1.智能性 信息资源是人类所开发与组织的信息,是人类脑力劳动或者说认知过程的产物。人类
的智能决定着特定的时期或特定个人的信息资源的量与质,智能性也可以说是信息资源的"丰度与凝聚
度"的集中体现。信息资源的智能性要求人类必须将自身素质的提高和智力开发放在及时位,必须确立
教育和科研的优先地位。
2.有限性 信息资源只是信息的极有限的一部分,比之人类的信息需求,它永远是有限的。从某种
意义上说,信息资源的有限性是由人类智能的有限性决定的。有限性要求人类必须从全局出发合理布局
和共同利用信息资源,较大限度地实现资源共享,从而促进人类与社会的发展。
3.不均衡性 由于人们的认识能力、知识储备和信息环境等多方面的条件不尽相同,他们所掌握的
信息资源也多寡不等;同时,由于社会发展程度不同,对信息资源的开发程度不同,地球上不同信息资源
的分布也不均衡,通常所谓的信息领域的"马太效应"就是与这种不均衡性有关的现象。不均衡性要求有
关信息政策、法律和规划等必须考虑导向性、公平问题和有效利用问题。
4.整体性 信息资源作为整体是对一个国家、一个地区或一个组织的政治、经济、文化、技术等的全
面反映。整体性要求对所有的信息资源和信息资源管理机构实行集中统一的管理,从而避免人为的分割
所造成的资源的重复和浪费。
三、信息检索
信息检索是指通过一定的方法,从信息集合中查出特定信息的过程。广义的信息检索包括信息的存
储与检索;狭义的信息检索仅指信息的检索,即从信息的集合中找到特定信息的程序和方法。
(一)信息检索原理
任何信息检索系统都具有存储和检索功能。信息检索原理就是指通过一定的方法和手段使存储和
检索这两个过程所采用的特征标识达到一致,以便有效地获取和利用信息。
1.信息存储过程 信息存储过程是由信息专业人员完成的。信息专业人员根据收集到的原始文
献的主题内容、学科归属以及其外表特征(标题、著者、来源、文种等)进行概念分析,选用特定的文献
信息检索语言表达相应的文献特征,再转换成对应的文献信息特征标识(如:主题词、分类号、篇名、作
者等),然后把这些特征性标识进行编排,按一定格式输入信息检索系统存储起来,完成信息的加工存
储过程。
2.信息检索过程 信息检索过程是用户根据信息需求,对检索课题加以分析,明确检索范围,弄清
主题概念,然后选用特定检索语言来表达主题概念,形成检索提问标识,根据提问标识到检索系统中查找
文献信息线索,对所查到的文献信息线索进行筛选,以确定需要阅读的文献。信息检索过程实际上是一
个比较、匹配的过程,检索提问只要与检索系统中信息的特征标识相一致,即找到了符合要求的信息。就
匹配运算而言,计算机检索和手工检索有很大的不同。计算机执行检索的过程,缺乏人脑的概念思维和
应变性,只是严格地按照输入的字符去机械地比较匹配,遇到多一个空格、少一个字符、词性变化、同形异
义、异形同义等情况,不能做出真实的判断,从而造成漏检。案例1-1-2中,"钠泵"有钠钾泵、Na+-K+-
ATPase、Na+,K+-ATPase、Na+,K+-ATP酶、Na,K-ATP酶、Na(+)K(+)交换ATP酶等多种表示形式,
输入不同形式的检索词就会得到不同的检索结果。为了保障检索结果的性,需要考虑到"钠泵"的所
有表达形式,将这些表达形式全部进行检索。
(二)信息检索类型
信息检索经历了手工检索、联机检索、光盘检索和网络检索等多个发展阶段,根据检索目的和检索对
象的不同,信息检索可以分为文献型信息检索、数据型信息检索和事实型信息检索。
1.文献型信息检索 文献型信息检索又称文献信息检索,通常以某些特定的文献为检索对象,其检
索结果是切题文献或相关文献的线索或全文。因此,文献型信息检索是一种相关性检索。根据检出内
容,文献型信息检索又可分为书目信息检索和全文信息检索。书目信息检索以检出文献线索和摘要为
主,为读者提供文献的简要信息和获取全文的线索。全文信息检索以文献的全文信息为主,全文信息的
阅读可为读者提供详细的信息,为研究提供参考和借鉴。文献型信息检索的内容深入具体,检索方法多
样,是信息检索的主体。完成文献型信息检索主要借助于各种检索工具和文献数据库。案例1-1-2欲查
找钠泵的分子药理学方面的文献,属于文献型信息检索。
2.数据型信息检索 数据型信息检索又称数值检索,检索对象为特定的数值数据,