在线客服

网络信息检索论文

引论:我们为您整理了1篇网络信息检索论文范文,供您借鉴以丰富您的创作。它们是您写作时的宝贵资源,期望它们能够激发您的创作灵感,让您的文章更具深度。

网络信息检索论文

网络信息检索论文:网络信息检索研究论文

[摘要]搜索引擎是人们使用Internet信息资源的重要工具。本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。

[关键词]信息检索中文搜索引擎存在的问题发展方向

随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。

一、搜索引擎的概念和及类型

搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。

目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。

1.目录式搜索引擎。目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的度较高,导航质量也不错。但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。国内著名的新浪、搜狐、中文雅虎都属于这种类型。

2.机器人搜索引擎。这是一种目前运用较广泛的搜索引擎。国内以百度,google、天网为代表。它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。

机器人搜索引擎具有庞大的全文索引数据库。其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。

3.元搜索引擎。元搜索引擎是一种调用其他搜索引擎的引擎。它是通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。中文元搜索引擎开发较少,较成熟的则更少,万纬搜索是目前有一定影响的中文元搜索引擎。

二、现阶段中文搜索引擎存在的主要问题

1.信息覆盖面有限。现阶段搜索引擎所覆盖的数据库的规模是非常有限的,据美国科学期刊Natures一篇报告中称,全球较大的搜索引擎也只能覆盖现有网页的16%。中文搜索引擎因起步慢、中文信息所占互联网全部信息的比例小(只占全部网络信息的5%)等原因在这方面尤为突出。

2.查全率不高。查全率是指检索出的相关信息量与存储在检索系统中的全部相关信息量的百分比,是判断检索系统质量的度量之一。

国内绝大多数的网站组织的信息大多都是通过浏览方式获得内容。即使是经过精心组织、编排非常合理的网站,也会有70%~80%的网页不能被搜索引擎检索到。中文目录式搜索引擎因需人工介入、维护量大,在这方面表现较明显。

3.查准率较低。查准率更是判断检索系统质量的重要尺度。是指系统所检索到的真正与查询内容相关的文档占检索出的所有文档数的百分比。

造成查准率低的原因是,部分搜索引擎的分类体系与科学知识体系之间缺乏内在联系;类目之间逻辑关系模糊,导致检索路径与搜索引擎类目错位;信息加工深度不够;检索功能单一;检索词的专指性较差;大部分的检索结果是题录式而非全文式,其内容简单等等。机器人搜索引擎的分类和索引缺乏人工的参与,其查准率不如目录式搜索引擎,且检索结果中还含有大量的重复、虚假的信息。

4.专业性的搜索引擎发展迟缓。专业性的搜索引擎是为专门收录某一行业,某一主题的信息而建立,能够提供专题信息查询服务的搜索引擎。目前中文搜索引擎大多是综合性的,能同时收录各行业、各学科的多种信息,但在反映某一行业或某一专题的信息方面很难做到、,不能给用户提供特定的信息服务。这就使得专业人员,特别是某一领域的学者、专家不愿意利用中文搜索引擎去查询资料。

5.检索功能方面存在缺陷。一是检索中符合布尔逻辑运算符的搜索引擎极为有限;二是关键词检索输出的结果相关度排序方式杂乱,不能根据用户需要来选择信息输出的方式;三是多数的搜索引擎是面向主题搜索不是面向用户搜索,不能重复利用用户检索过的成果,更不能对特定的用户进行定题跟踪服务;四是检索网站的主页不规范,有些太简,有些又太繁,而且广告内容太多,无法进行有效检索。三、中文搜索引擎的发展方向

1.提高查全率。首先是需要开发分布式的系统。这种系统可以把各个接点当作是新的信息资源,扩大数据库的规模,正在兴起的元搜索引擎属于这种系统,它在接受了用户的查询命令后,可同时用多个搜索引擎进行查询;二是把专业数据库资源纳入自己的检索范围。除了Web信息资源外,网上还有大量的非Web信息资源,如联机检索系统、光盘检索系统、专业数据库系统。如中文搜索引擎能把这些Web和非Web资源结合起来使用,即使有的只能查到题录、文摘等内容,也大大扩展了检索范围,能为用户提供较的检索需求。

2.提高查准率。需解决以下几个难关:首先需提高搜索引擎的信息过滤功能。在对网络信息进行集中的搜集之后,搜索引擎还需对这些信息进行鉴别和过滤,即剔除大量的无用信息,而把有效的信息提炼出来并加以聚集;第二则是需对专家过滤后的信息进行一定的检索标引,并给予相关的标识符号,如关键词、分类号、主题词等各种标识,其关键是利用智能检索技术,提高性;把检索的结果存储在相应的数据库中,并由URL与Internet建立链接供用户使用;还需注意信息定期更新,以保障信息的新颖性和链接的性。

3.建立垂直化专业领域的搜索引擎。网络用户所从事的职业千差万别,不同的用户对信息搜索往往有不同的要求。综合性的搜索引擎收录的范围太广、太大无法满足某一特定的需求。垂直化专业搜索引擎则可解决这一难题。它只面向某一特定的领域,专注于自己的特长和核心技术,能保障对该领域的信息的收录齐全与更新迅速。在提供专业信息方面有着大型综合搜索引擎无法比拟的优势,所采用的技术都是些较成熟的技术。

中文垂直化专业搜索引擎的发展已取得了一定的成功,如新浪的新闻搜索,博客搜索、雅虎的个性化旅行路线搜索、百度的MP3搜索、Google的学术搜索,航班搜索等都为用户提供了较好的搜索功能,为今后的继续发展奠定了基础。

4.搜索引擎的智能化发展。智能搜索引擎是未来搜索引擎的发展趋势。可以通过自然语言与用户交互,较大限度地了解用户的需求。智能检索一是表现在搜索引擎技术的智能化,研究重点放在自然语言处理技术和人工智能技术的研究上;另一表现是体现在搜索引擎面向检索者的智能化,它致力于通过分析检索者的检索和浏览行为来学习检索者的需求,利用搜索引擎现有的服务有选择地为检索者提供个性化的服务。

5.加强搜索引擎的检索功能。首先需强化全文检索功能。利用Robot实现对站点页面文字内容的检索技术。比起目录检索,全文检索提供了全新的检索功能,可以直接根据文献资料的内容进行检索,支持多角度、多侧面地综合利用信息资源,、、快速是衡量全文检索系统的关键指标;同时改善用户检索界面,设计简洁、明白的界面引导用户进入检索状态;更方便、实用的检索技巧的利用,中文搜索引擎需简化和统一语法规则,如布尔逻辑检索符号的利用:空格或“*”代替“与”、“+”代替“或”、“-”代替“非”,规范语法符号,节省用户的检索时间;还需研发查询图像、声音、图片和电影的搜索引擎。

6.完善元搜索引擎。元搜索引擎弥补了独立搜索引擎不全的特点,提高了检索的性。现开发出的中文元搜索引擎的数目很少,还有诸多缺陷,需在各方面进一步改进。

元搜索引擎要对各独立的信息特色进行较细致的调查,以确定自己要收录的范围;在对目标搜索引擎的组织中突出独立搜索引擎的检索特色,并设计各搜索引擎之间的检索方式的转换算法,提高用户检索行为的针对性;建立更为灵活的,面向用户的信息检索服务。检索界面要统一和友好,检索方法的设置要提供给用户更多的自由空间,使用户可以按照自己的意愿合理的组织检索式;在检索结果的显示中要开发出一个有效的检索结果去重、选择、排序和优化算法,这是中文搜索引擎开发中的一个重点和难点。

网络信息检索论文:浅谈网络信息检索的现状及其发展趋势

【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。

【关键词】网络信息检索;现状;发展趋势

1.信息检索概述

信息检索(Information Retrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。

随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。

2.网络信息检索的现状

对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。

3.网络信息检索的现行模式

3.1 网络全文数据库检索

网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文期刊数据库。前者主要是那些期刊出版单位在其出版的印刷期刊基础上建立的网络电子期刊全文数据库。而后者则是由数据库生产商根据一定的主题或一定的收录范围整合一定数量的期刊出版物而产生的全文数据库。国内全文数据库主要有中国学术期刊全文数据库。

3.2 网络搜索引擎检索

搜索引擎是一个专门的系统,它可以对互联网信息资源进行搜索整理和分类,并将其储存在网络数据库中供用户查询。搜索引擎包括搜集信息、分类和用户查询等三大部分。目前流行的搜索引擎有两大类:关键词全文检索式搜索引擎和分类目录式搜索引擎。

关键词全文检索式搜索引擎主要利用其内部的搜索机器人和蜘蛛程序,自动搜索来自互联网上的各种内容,在每一个关键词和所有相关的网页之间按照网页相关性原理建立一个对应关系,储存在其网络服务器的数据库中。用户只要输入关键词就可以找到符合该关键词特征的所有被索引的网页,搜索结果以超链接的方式列表,搜索结果有简单介绍,用户点击相应的链接就可以进入相应的网络资源网站,从而找到所需信息。用这种方式搜索到的结果通常数以百万计,但是相关性越高的信息,在搜索结果列表中的位置越靠前。分类目录式搜索引擎将互联网信息按照一定的标准进行收集和分类,并编入相应目录,以层级和逐次分项的方式管理目录,查找信息可以按照分类目录一层层进入,最终找到所要的信息。

3.3 互联网“超链接”搜索

Web信息以超文本链接方式组织,基本组织单元是信息节点而不是字符串,信息节点之间通过链接进行联系。超链接是网页必不可少的一个元素,同一主题或相关的信息因超链接构成了信息网。超文本信息检索技术,以超文本信息节点之间的多种链接关系为基础,根据思维联想或查找信息的需要,通过链接从一个信息节点转到另一个信息节点。

4.网络信息检索的未来发展趋势

网络技术的发展,给网络信息检索及信息的网络化带来的极大的便利,进一步推动了网络信息检索理论和技术的快速发展。怎样为网络用户提供高质量、高效率的检索方式是网络信息检索研究者的努力方向。信息检索的对象已从传统的文本信息扩展到如今开放、动态、分布广泛的多媒体信息。那么,网络信息检索的发展趋势如何呢?

4.1 智能化信息检索

智能化信息检索是基于自然语言处理的检索形式。检索工具是对用户提供的以自然语言表达的检索要求进行分析,从而形成检索策略进行检索。检索工具智能化的内涵在于检索工具具有学习、分析、辨别和推理的能力。近年来,因特网上不断涌现的人工智能产品,如智能搜索引擎、智能浏览器、智能等,它们将提高网络信息检索的智能化程度,促进智能信息检索的发展。

网络中的智能通常是一个专家系统、一个过程、一个模块或一个求解单元。智能可以获得用户的信息需求,自动检索信息和推送检索结果信息。多智能系统还具有信息发现、信息筛选、信息推送和信息导航功能,可满足专业研究人员的特定需求,实现网络信息检索与服务的智能化。

4.2 一站式信息检索

一站式(One Stop)信息检索是指用户通过一个检索工具能满足自己所有的信息检索需求。一站式信息检索将是网络信息检索服务的一种发展模式。一站式检索服务是人性化服务的重要体现,它将大量节约用户的检索时间。全球较大的搜索引擎Google正在朝着一站式服务的方向发展。2004年12月,Google宣布与纽约公共图书馆和包括哈佛大学图书馆在内的4个主要图书馆合作,将这些图书馆的大约1500万册藏书扫描进自己的数据主库以提供网络用户检索。目前,Google已经为其用户提供了某种程度上的一站式的检索服务了。而其他越来越多的检索服务提供商将向一站式检索方向发展。

4.3 可视化

可视化指的是运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。据统计,获取信息有70%~80%靠视觉,20%靠听觉,10%靠触觉。用图像取代文字帮助人们检索的优点在于:图像的表达更生动、结束语形象、,效率更高,具有交互性、多维性、可视性等特点,可以大大加快检索速度,使时刻都在产生的海量数据得到有效利用。

4.4 商业化

目前网络信息检索系统已成为新的投资热点,网络信息检索系统不再仅仅是一种检索工具,而且是一种商业产品。2001年10月,全球较大的中文搜索引擎提供商百度()联合新浪等多家中文门户网站,共同推广“搜索引擎竞价排名”全新网络商业服务模式。网络信息检索的商业化还体现在联机和光盘检索逐渐进入网络环境。由于目前网络信息检索的检准率低,联网的收费联机和光盘检索依旧受到青睐,如世界著名的联机信息系统DIALOG、OCLC、EBSCO、Silverplatter,国内的万方数据资源系统、中国学术期刊光盘、重庆维普公司系列光盘等都纷纷在网上设立自己的网络检索入口。许多著名科技期刊的上网丰富了网络资源,它们大多数都是在提供印刷版的同时提供期刊的网上服务,包括收费检索。

5.小结

在的网络信息资源中寻找自己所需要的信息资源是一件具有挑战性的工作。为此,许多信息专家正在积极地研究探索,并且取得了不少成果。我们相信随着科学技术的进步,网络信息检索发展会越来越快,人们所利用的检索工具和手段的更替会更加频繁。

网络信息检索论文:网络信息检索环境下的语义检索研究

摘要: 互联网给用户的信息检索带来便利的同时也导致大量冗余信息出现,使得检索效率低下。语义检索通过对用户检索要求的语义分析使得检索效率以及检索度大大提升。本文在分析语义检索基本要素和检索原理的基础上,介绍三种常用的语义检索系统,体现语义检索在网络信息检索环境下的优势。

0 引言

互联网的快速发展和广泛应用,为人们提供了一个广阔的信息空间,也为信息检索提供了一个广阔的发展平台。互联网的开放性和自由性使得网络信息资源呈现出数量巨大、异构性、分散性和动态性特征。但由于网络信息时效性强以及互联网缺乏必要的监督和质量控制,使得大量垃圾信息混于高质量信息当中,增加了有效信息获取的难度,影响检索效率。因此,使用有效的检索工具才能使得网络信息资源为人们所充分利用。

1 网络信息资源点与检索工具

上世纪90年代中期出现的搜索引擎技术目前已经成为检索各类网络信息资源最主要的检索工具。搜索引擎一般工作流程是借助于网络自动搜索软件(Robot、Spider等)访问浏览网页并抓取文件,并通过已浏览的网页中的链接访问更多网页。在抓取网页的同时对页面文件进行分析分解以及索引,建立索引数据库。当用户在搜索引擎界面输入搜索词后,搜索引擎对搜索词进行处理,按照处理后的搜索词在索引数据库中找出所有包含相关内容的网页,并更具排名算法计算出排名顺序然后按照一定的格式返回到搜索页面。普通的搜索引擎缺点在于返回的检索结果数量巨大,无关和冗余信息较多,用户必须从中进行筛选。虽然布尔运算、截词运算、自然语言检索等技术使用大大提高了率,但对用户检索素养要求很高。针对以上问题,学者把研究对象放到对词意的挖掘上,探索实现基于概念匹配的检索技术和方法,基于本体的语义检索成为研究重点。

2 语义检索基本要素和原理

随着人工智能以及自然语言处理的发展,尤其是语义网技术的兴起,自上个世纪以来语义检索研究得到了迅猛的发展。虽然对于语义检索在概念上到目前为止没有统一的界定,但是不同的研究都有一个共同之处就是基于对信息资源的语义处理时限效率更高的检索[1]。本体是语义检索的基础,其主要任务是对信息资源进行语义表达。

本体(Ontology)原本是一个描述客观事物本质的哲学概念,是对客观存在的一个系统的解释和说明。如今,本体是一种能在语义和知识层次上描述概念体系的有效工具,用来描述概念以及概念之间的关系,通过概念之间的管理来描述概念的语义。本体作为一种的知识表示方式能够充分的描述所以的数据结构,是推理和关系数据库的结合[2]。概括的讲本体能够在人们和应用系统之间达成对术语含义的共享和共同理解,通过函数(functions)、关系(relations)、原则(axioms)和实例(instances)、类(classes)这5种元素表达本体中的知识,使其具有逻辑推理和语义识别功能,帮助检索系统跨越目前基于关键词的检索过程中的上述问题以实现语义检索[3]。目前实现网络检索的技术主要有两种:及时种,依赖于编码处理,以分类模式来描述信息资源以实现检索的目的;第二种,是通过全文检索查找文本中包含用户指定的词语的信息源。语义检索的语义信息的提取和处理是基于语义网方法与技术的查询处理与文档标注及索引。基于本体的查询处理包括:查询消歧和查询扩展,通过消岐,明确查询的确切所指,反映用户的信息意图,继而通过加入与其语义相关的其他概念来实施扩展。在对文档进行语义标注与索引的基础上,先进行实例检索,再据此返回所有以检出实例标注的文档信息是语义标注文档检索的一种普遍思路。相对于传统的网络检索,基于本体的语义检索的优势在于体现语义信息,表达用户的查询意图。

3 常见语义检索系统介绍

3.1 一体化医学语言系统(UMLS) UMLS(Unified Medical Language System)作为计算机化的情报检索语言集成系统,是美国国立医学图书馆(NLM)主持的一项长期开发研究计划。它不仅是自然语言处理、语言规范化以及语言翻译的规范化工具,更是实现实现跨数据库检测的词汇转换系统并且还可以帮助用户连接情报源,包括书目数据库、事实数据库、计算机化的病案记录以及专家系统过程中对于其他的电子式生物医学情报的一体化检索。UMLS包括情报源图谱(Information Sources Map)、语义网络(Semantic Network)、专家词典(SPECIALIST Lexicon) )和超级叙词表(Metathesaurus)四部分。其中超级叙词表是术语、生物医学概念、等级范畴、词汇及其涵义的广泛集成。1997年第8版的超级叙词表收录了739439个词汇,这些词汇来源于30多种生物医学词表和分类表的能表达33万多个概念的,词汇量达到空前规模。而语义网络是为超级叙词表中的所有概念提供语义类型及相互关系结构的工具,是为建立概念术语间相互错综复杂关系而设计的。UMLS的语义网络不仅运用了常规的语义控制手段,如属分、相关关系控制、语义等级,同时在语义规范和语义关系分析、延伸等多方面有许多创新。

3.2 语义网(Semantic Web) 为了能够在网络环境下也同样实现语义检索的功能进而开发研究了语义网的W3C项目。W3C项目是将网络上的数据通过一种方式进行连续和定义,通过这种定义和连续可以根据人的不同需求实现计算机将数据自动进行整合以及再利用,从而达到更有利于人机协作的目的。资源描述框架(Re-source Description Framework,简称RDF)是语义网的核心构件。在网络中,一般用元数据对资源进行描述,而RDF则是处理元数据的一个基础。RDF认为一个具体的元数据是由属性值(Statements)、属性(Properties)和资源(Resources)构成的三元关系模式[4],实际上是关于一个特定的资源特定属性的取值声明。使用RDFS语言,元数据的设计者不仅可以定义所描述资源的类别、属性以及词汇,还可以定义这些属性或者对象的关系以及对象与属性之间的相互关系,同时还可以进一步定义这些资源的对象、属性以及属性应用类别和取值条件等,通过这些定义从而能以计算机理解的标准方式对元数据进行描述语义内容以及元数据的结构关系。

3.3 WordNet WordNet是一种基于认知语言学的英语词典,它是由普林斯顿大学的计算机工程师、心理学家和语言学家联合设计的不仅是把单词以字母顺序排列,并且是按单侧的意义组成的一个“单词的网络”。WordNet将所有的英语词汇按词性分为功能词、形容词、动词、名词和副词五类。动词被组成各种推演关系;名词在词汇记忆中被组成主题的层次;而形容词和副词被组织在N维超空间中。根据WordNet关系分析较大的优势是能在他的单词网里通过相关关系消除歧义,因为WordNet分析主要是关系分析。WordNet在名词的语义消歧率可以超过60%。

4 结语

从以上三个语义系统来看,无论是相对封闭的ULMS系统还是开放式的语义网、wordnet系统都具有较强的灵活性和扩展性。相对于常见的关键字信息检索,语义检索不需要用户使用专业的检索策略,也不需要语法严谨的检索式,用户可以将自己的信息需求通过自然语言直接表达出来。语义检索在后台经过大量的计算,分析用户的用户的语义文档信息,充分利用各种语义关系消除歧义将用户真正需要的的信息资源反馈给用户,将用户的检索效率提升60—80%。因此,语义检索无疑是当前信息爆炸条件下最适合的网络信息检索方式。

网络信息检索论文:网络信息检索中的图像检索技术

[摘 要] 图像检索是网络信息检索中的重要的组成部分,而其检索技术却相对滞后。基于内容的图像检索已成为网络信息检索技术的研究热点。本文分析并总结了图像检索的概念,综述了基于内容的图像检索系统和相关技术。

[关键词] 网络信息检索; 基于内容; 图像检索技术

随着网络信息资源的迅速增加,信息多样化的程度不断加大,诸如图形、图像、音频、视频、动画等多媒体信息日渐丰富,其中图像信息的需求尤为大量,而当前主要以文本方式进行检索的技术已不能满足人们对信息的需求。

基于文本的检索是搜索引擎将网站、网页的内容索引为一系列的关键字,当用户输入相应关键字后,系统根据数据库中的倒排文档将关键字映射为网站或网页的地址。图像信息基于文本的检索技术,即根据图像信息的文件名、路径名、ALT标签等,将其标注为一系列关键字的描述,然后通过检索这些描述以达到检索图像信息的目的。这种检索技术很不实用。首先,由于目前的计算机视觉和人工智能技术都无法自动对图像进行标注,要由人工完整地标注网络上的所有图像,不但费时费力,而且往往是不或不完整的;其次,不同用户对于同一张图像的看法不尽相同,导致对图像的标注没有一个统一标准;再次,这种方法将注意力局限在图像的著录特征,即文字描述上,不能充分揭示和描述图像中有代表性的画面内容特征。所以基于内容的图像检索技术应用而生。

1 基于内容的图像检索技术

基于内容的图像检索一般是指静止图像的检索。这种图像检索技术通过分析图像的内容,提取其颜色、形状、纹理等可视特征,建立特征索引存储于特征库中,在检索时,用户只需把自己对图像的模糊印象描述出来(绘制的草图或通过扫描仪等在线输入的图像),就可以通过多次的近似匹配,在大容量图像库中查询到所需图像。基于内容的图像检索具有较强的客观性。

基于内容的图像检索算法涉及的相关技术比较多,主要有:图像的分析与特征向量的提取技术、特征向量数据的组织与存储技术、图像数据的组织与存储技术等。

1.1 基于颜色特征的图像检索

颜色特征是图像检索中最基础的一种检索依据,颜色是人识别图像的主要感知特征之一。在基于颜色特征的检索算法中,通常用颜色直方图来表示图像的颜色特征。直方图能较好地反映图像中各颜色的频率分布,横轴表示颜色等级,纵轴表示在一个颜色等级上,具有该颜色的像素在整幅图像中所占的比例。直方图可以对整幅图像进行较大匹配度检索。目前关于色彩的索引方法有两类:基于全局色彩的索引与基于局部色彩的索引。

全局色彩的索引就是按全局色彩的分布来索引图像,计算每种颜色的像素,检索出具有相同颜色内容的像素的图像。其中最为简单有用的工具是灰度直方图。利用图像的灰度直方图作为特征指标来描述图像,一般是利用二维直方图,如红—蓝直方图,它是红光图像的灰度值和蓝光图像的灰度值的函数。利用色彩直方图进行检索的方法有许多,如:比例直方图法、累加直方图法等。

色彩直方图还不能为像素在图像中的位置提供线索,为了尽可能少地丢失信息,提出了局部色彩方法。局部色彩的索引对象是局部相似的颜色区域,它考虑了颜色的分类和一些初级的颜色特征。用形状面积、圆度、离心率等来描述形状的特征矢量。

1.2 基于形状特征的检索

形状是刻划物体的本质特征之一,利用形状来检索可提高检索的性和效率。基于形状的检索不仅包括传统意义的基于二维形状的检索,还包括三维形状的检索。

基于图像内物体形状的检索,首要问题是采用合适的图像分割算法把不同对象从图像中分割出来,关键是寻找符合人眼感知特性的形状特征。目前,较好的方法是采用图像的自动分割方法结合识别目标的前景和背景模型来得到比较的形状特征。图像自动分割方法的具体思路是:将图像分块后,将每个块看成是一幅小图像,计算每个小图像的颜色直方图特征,则每个块间的直方图是不一样的,为分析边缘特征,将相邻两个块构成一个比较对,将每个块间的差值记录下来,同时记录差值在一定范围内的数目,这样就形成一个颜色特征差值表。图像对象空间位置发生变化,其特征差值表也就不同。

1.3 基于纹理特征的检索

纹理是指图像在局部区域内可能呈现出不规则性而在整体上却表现出某种规律性。纹理特征是图像中难以描述的特征,它是一种反映图像像素灰度级空间分布的属性。如果一个物体内部以灰度级变化明显而又不是简单的色调变化,那么该物体就有纹理。

纹理分析的方法基本可以分为统计法、结构法、模型法和空间法/频率域联合分析法等4类。基于统计的方法是对图像中的颜色强度的空间分布信息进行统计,主要用于分析像木纹、沙地、草坪等细致而不规则的物体;基于结构的方法将重点放在分析纹理元之间的相互关系和排列规则上,适用于像布料或砖瓦等一类元素组成的纹理以及排列比较规则的物体;基于模型的方法是假设纹理按某种类型分布,如Markov随机场模型、分形模型等。基于空间/频率域联合分析法主要包括Cabor变换法和小波变换法等。

1.4 基于知识的图像检索

基于知识的图像检索也是基于内容检索的重要方法之一。图像本身是一定数量的颜色像素点的集合,人类能够识别出像素点集合的含义是人类以自身的知识赋予图像意义的过程。基于知识的图像检索系统为用户提供知识库,针对一个图像需求,搜索引擎依次调入每一幅图像的内容描述,结合知识库中的相关知识,以图像需求为目标进行推理,如果需求目标得到满足,则确定这幅图像符合检索要求。

2 基于内容的图像信息检索系统

目前,基于内容的图像检索技术的研究取得了很大的突破,较有影响力的有以下几个:

2.1 QBIC系统

QBIC(Query By Image Content)是IBM公司于20世纪90年代研制的图像和动态影像检索系统,其含意是“根据图像的内容进行查询”。由IBM Almaden研究中心开发,是基于内容的检索系统的典型代表。QBIC在检索过程中用户无须提供文字检索词(它也提供关键词检索),只要输入以图像形式表达的检索要求,即可检索出一系列相似的图像。QBIC系统允许使用示例图像、用户构建的草图、选择的颜色与纹理模式、镜头与目标运动等,对大型图像和视频数据库进行查询。

2.2 Photobook系统

Photobook系统是由美国麻省理工学院(MIT)的媒体实验室于1994年开发研制的用于浏览和搜索图像的一套交互式工具,图像在存储时按人脸、形状或纹理特性自动分类,图像根据类别通过显著语义特征压缩编码。

2.3 Virage系统

Virage是由Virage公司开发的基于内容的图像搜索引擎。与QBIC相似,Virage支持基于颜色、颜色布局、纹理和结构(对象边界信息)的可视化查询,但Virage比QBIC更进一步,它也支持由4个原子查询的任意组合,用户可以根据他们自己的侧重调整4个原子查询的权重。

2.4 CORE系统

CORE是新加坡国立大学开发的一个基于内容的检索系统。其显著的技术特色包括:多种特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。

2.5 VisualSEEK系统

由美国哥伦比亚大学图像和高级电视实验室开发。它实现了互联网上基于内容的图像/视频检索系统,提供了一套工具供人们在Web上检索图像和视频信息。用户可以把顶部为红橙黄色区域、底部为蓝绿色区域,这样的图像作为查询“日出”的草图,使人们在Web上可以方便地搜索和检索图像和视频。

3 基于内容的图像检索体系结构

基于内容的图像检索系统与传统基于文本的检索系统不同。基于内容的检索系统一般通过可视化界面和用户进行频繁的交互,以便用户能够方便地构造查询和改进检索结果,用户通过选择具有代表性的一幅或多幅例子图像来构造查询,然后由系统查找与例子图像在视觉内容上较相似的图像,按相似度大小排列返回给用户,即所谓的通过例子图像的检索(Query By Image Example)。

基于内容的图像查询和检索是一个逐步求精的循环过程。其过程及各个模块如下:

3.1 图像的预处理

在特征抽象子模块里,首先要进行图像的预处理,包括图像格式的转换,尺寸的统一,图像的增强与去噪,图像的边缘提取,经过边缘提取获得图像的轮廓特征,对其进行进一步轮廓清晰化处理等功能,为图像的特征提取打下基础。

3.2 图像的目标标识

图像预处理后,要进行图像的目标标识。目标标识为用户提供一种工具,以全自动或半自动(需要用户干预)的方式标识图像中用户感兴趣的区域或目标对象,以便针对目标进行特征提取并查询。当进行整体内容检索时,利用全局特征,这时不用目标标识功能。目标标识是可选的。

3.3 图像的特征提取与表达

图像特征的提取与表达是基于内容的图像检索技术的基础。对图像数据库进行特征提取,提取用户感兴趣的、适合检索要求的特征。特征提取可以是全局性的,即整幅图像,也可以是针对某个目标的,即图像中的子区域,如人的面部特征或指纹特征等。

3.4 图像数据库

作为图像查询的后台基地,生成的数据库由图像库、特征库和知识库组成。图像库为数字化的图像信息,特征库包含用户输入的特征和预处理自动提取的内容特征。知识库包含专门和通用知识,有利于查询优化和快速匹配,知识库中知识表达可以更换以适用各种不同的应用领域。

3.5 图像的查询接口

在基于内容检索中,由于特征值为高维向量,不具有直观性,因此必须为其提供一个可视化的输入手段。友好的人机交互界面是一个成功检索系统不可缺少的条件,可采用的方式有3种:操纵交互输入方式、模板选择输入方式和用户提交特征样板的输入方式。另外,查询返回的结果需要浏览,应在用户界面提供浏览功能。

3.6 图像的检索引擎

检索是利用特征之间的距离函数进行相似性匹配,模仿人的认知过程,近似得到数据库的认知排队,存在一些不同的相似性测度算法,检索引擎中包括一个较为有效的相似性测度函数集。

3.7 图像的索引/过滤

索引是用来提供快速、有选择性地存取数据库的一种机制,它相当于一种映射机制,将属性的值转换为相应数据地址域的地址集。过滤器作用于全部数据,过滤出的数据集合再用高维特征匹配来检索。索引用于低维特征,可以用R树来索引以加快检索速度。

基于内容的图像检索技术为用户提供了一个在网络上搜索感兴趣的图像信息资源的有效手段,但基于内容的图像检索技术目前还存在许多有待发掘的内容,因而,基于内容的图像检索技术也需要随着网络技术、信息技术的发展而发展。

网络信息检索论文:光盘网络信息检索系统开发与应用

摘要:光盘网络信息检索系统是图书馆信息服务的核心,面对信息服务供求紧张、矛盾日趋激烈,如何高效的开发光盘信息检索系统,并应用在不同领域俨然已经成为信息服务产业的一个重要环节。本文将以自发研制的图书馆光盘网络检索系统为例,并针对其运行环境、基本性能以及应用情况等等做出相关讨论。

关键词:光盘网络信息检索系统;开发;应用

随着科学技术的迅速发展,信息产业更是异军突起,前景一片大好。因此这也就造成信息服务供求关系严峻、矛盾突出,特别是应用于图书馆的信息检索系统。信息检索系统在图书馆的只用查阅中起着至关重要、不可或缺的作用,但由于我国国内图书馆众多,特殊时期时光盘网络的应用条件和应用环境并不完备和事宜,因此如何开发应用光盘网络检索系统也是我国信息化产业的重要环节。本文将以某图书馆自行开发研制的光盘网络检索系统——Medical CD–ROMNET为例,着重探讨光盘网络检索系统的运行环境、基本性能应用情况以及现今尚存在的问题和解决办法等等。该系统是一种经过自发研制并研究试用的一款光盘网络检索系统,主要作用于局域网,并应用在图书馆领域。该系统具有费用低、方便易行等诸多有点,十分理想,下面将从四个方面分别进行讨论:

1 光盘网络检索系统的运行环境

该光盘网络检索系统是已DOS作为系统操作系统,并把网络服务器驱动程序—SERVER.EXE作为开发基础,在NOVELL的IPX/SPX协议的光盘局域网络的基础上研发而成。图书馆信息检索系统含有多个工作站和数据库,其驱动程序都分别装在各个工作站的微机中,并通过光盘网络检索系统来实现各工作站之间的联系。这样一来明确了各个工作站之间分工,有效的利用空间资源等等,也保障了各工作站以的状态进行检索信息服务。另外各工作站可根据用户方便来使用不同的操作系统,极大程度上的方便用户使用。也实现了主程序与各个工作站相互配合,以及主程序对各个子工作站的控制作用的体现。

另一方面,该光盘网络检索系统的运行环境要求比较低,一般普通计算机即可达到指标,服务器主机达到4兆及4兆以上即可达到标准,而各工作站由于直接接触用户,对内存方面并无要求。同时,服务器还要求含有软驱,通过网线与各个子工作站相连接,而子工作站方面可以在不影响与主服务器的有效连接外,按照需要添加打印机、磁盘驱动器等设备,以方便用户进行信息检索服务。因此该系统彻底的实现了各子工作站与主服务器硬件上的相互独立,使得用户可以任意的使用各工作站的硬件资源而并不影响服务器与各驱动之间的正常工作,极大程度上的实现了资源的充分利用,也避免了很多昂贵的不必要的开销费用,这也使得国内很多图书馆采用光盘网络检索系统的主要原因之一。

2 光盘网络检索系统的性能

光盘网络检索系统的模式与文件服务器模式相类似,整个光盘网络检索系统只有一个主服务器,有一个较高配置的计算机以及光盘驱动器组等构成,通过网线与各个字工作站相互连接,各个子工作站由任意配置的计算机和数据库的驱动程序构成,同时主服务器还可通过远程工作站连接有私人工作站和科室工作站,这就是光盘网络系统的大体模式。

所有的光盘驱动器都集中在主服务器上,而通常专用于驱动与共享光盘驱动资源的即为服务器上的软件程序。虽然光盘驱动器全部集中在主服务器上,但是由于主服务器与各子工作站之间的有效连接使得用户在使用过程中,就好像光盘驱动器就在本地一样,更加方便了用户的信息检索服务。该模式的光盘网络检索系统采用文件服务器模式,因此秉承了其很多不可替代的优点,安全性好,性能稳定而且十分节省耗资等等。另一方面由于主服务器与各子工作站直接相连,因此对于集中管理和维护变得十分的方便。同时,一旦用户提出信息检索需求,各子工作站可单独提供检索服务,但前提实在网络连接并无错误时,主服务器可有效工作。而当各个子工作站计算机不使用甚至是关机或故障并不影响主服务器的工作,和其他子工作站的信息检索服务,实现了总体与个体、个体与个体之间的紧密联系和相互独立。

3 光盘网络检索系统的应用情况

光盘网络检索系统可广泛应用于图书馆的信息检索服务,应用情况如下:主服务器为386SX/33兼容计算机、4兆内存,含有软盘驱动器以及4个外置式和2个内置式光盘驱动器,除了含有科室远程工作站和私人远程工作站外还含有8个关内的子工作站。个人或科室可以通过该工作站随时进行信息检索服务,各个子工作站可包含不同的服务类型,其中情报服务组、教育组、流通服务组和期刊服务组分别占5个、1个、1个和2个.数据光盘具有容量大,安全性高,性强等特点,保障数据的记录、查找和筛选。另外,图书馆可以在驱动器中添加资源光盘以引进更多的文献资源,使得各个子工作站共同享有的文献资源。检索系统在工作过程中各个子工作站用户可以利用自身的硬件资源等等进行筛选和处理得到所需要的服务信息,而个人或是科室则可通过电话线、网络连接等方式随时的进行远距离操控,实现对文献的检索和筛选,检索过程中与各个子站的检索服务并无区别,因此大大的减轻了图书馆情报部门的负担,使得情报服务组可以更加高效率的进行工作,也使得整个图书馆的信息检索服务变得更加顺畅和便捷,用户对此也十分满意。

4 存在的问题和解决办法

虽然通过应用自发研制的网盘网络信息检索系统具有诸多优势,比如方便快捷、高效提供用户对于信息的检索服务、可添加共享文献资料、可实现远程操控、耗资成本低以及维修简单等等多个有点,但在应用过程中仍会发现很多的不足,在此将分别讨论各个缺点和不足,并讨论和提出相应的解决办法。首先,主服务器的工作效率受子工作站与驱动器数目的影响极大,过多的工作站或驱动器不可避免的导致服务器超负荷运行,导致服务器运行缓慢,甚至是出现死机的状况。出现这种情况的原因可以用系统服务器的工作原理来解释,光盘网络信息检索系统的服务器CPU的工作方式是分时处理任务,也就是说检索服务是严格按照申请的时序来今后进行服务的,然后由于时间非常短而用户一般察觉不到。但是正式由于这种分时处理任务的方式决定了分配给每个申请占有CPU的时间有限,另外还要进行数据的输入、输出和处理筛选等等。那么当各个子工作站或驱动器的数目过多时,超过了主服务器正常工作的范围时也就很自然的导致运行速度严重缓慢,严重时甚至可能出现网络崩溃的状况。这是信息检索系统最常见的问题,解决方法通常从三个方面来出发,及时就是提高服务器的硬件设置,比如增加内存,更换更高性能的处理器等等。第二是严格控制光盘驱动数目和工作站的数目,将其控制在一定的指标,保障服务器能够正常或是高效的工作。第三则是要组织专门的维修和保护人员成立维修小组,定期对于主服务器以及各个子工作站、个人工作站或是科室工作站,以及数据库、驱动程序的检测、维修和保护。保障图书馆的信息检索系统始终能够以较高的效率服务于用户。

纵观我国信息产业的发展,信息服务行业由于供求关系激烈而变得十分紧张,发展信息服务,开发应用光盘网络信息检索系统可以更加方便快捷的服务于人群、服务于社会。

网络信息检索论文:信息检索课网络多媒体课件系统设计

【摘要】本文采用网络多媒体技术设计和开发的信息检索课网络教学课件,本系统体现和贯穿了素质教育思想,注重学生的知识与能力的协调发展,有利于提高当代大学生的综合素质。

【关键词】信息检索课;多媒体课件;系统设计

一、引言

美国教育心理学家克拉克(Clark)说:能引起教学质量变化的是使用媒体的方法——软件的设计,而不是媒体本身,因此,在设计网络多媒体课件系统时我们着重考虑以下几点:

(1)知识内容的新颖:在讲述信息检索知识基础上,重点介绍检索工具的使用及网上信息资源的开发,并将文献的筛选、鉴别、利用融于检索之中,突出实用性。

(2)基础理论部分是吸引学生和引导学生深入学习的基础,但涉及较多概念和抽象性问题,也是学生较难理解的部分内容,要求课件通过视频等方式,化静为动,化难为易。

(3)涉及到具体的实验和操作方法的内容,操作性强,既是重点,又是难点,要求真实演示和记录其过程或以视频形式展示其过程。

(4)设计风格的规范性和灵活性:对课程内容的整体功能上实现较为严格的规范,而在具体内容的表达上,根据内容的需要,进行灵活的个性化设计。通过功能键可以控制课程进度,便于学生灵活掌握进度。

二、网络多媒体课件系统的设计与开发

1.网络多媒体课件系统设计及开发要求

(1)学生自主性学习。学生可以根据自身不同的要去选择使用不同的媒体形式、不同的教学内容和教学进度来自主学习。

(2)系统的开放性。展示教学内容中的素材。

(3)系统的可扩性。教学内容,形式可随时增加、删除、修改。

(4)系统的可控性。课件的导航清晰明确,链接、无死链接。

(5)系统的易用性。降低课件开发难度,克服下载延迟时间过长或存储空间不够的技术问题,保护知识产权。

2.网络多媒体课件系统总体设计

总体设计包括结构和内容的设计、功能的设计。在教学内容确定后,如何将这些知识内容在计算机上通过灵活多样的形式加以表达,发挥多媒体的优势,突破教学难点,突出教学重点,培养学生的素质和能力。整体上需要进行的、系统的结构和功能设计;更具体的表现在对课程内容、封面导言、界面、交互方式、导航、超文本等设计。

(1)结构及内容设计

该系统包括信息检索基础理论、手工检索工具介绍和计算机检索系统三个模块。每个模块下又分课程简介、课程学习、专题论坛四个子功能模块。

课程简介;简单介绍本学科信息检索课的主要内容,学习的重点、难点及学时安排。

课程学习:它是信息检索课网络课程的主体部分,以篇、章、节纵向目录导航为主线展示学习内容,将所有检索工具从概况、编排结构、检索途径、实例分折、练习等五个层面展开介绍,针对与教学内容相关的、较重要的名词、概念、定义、教学用图、表以及实例分析等设置了相关链接;

专题论坛:设置了有关信息检索与利用的专题讨论组,体现出人机交互和人人交互的功能,在讨论区,学生可以通过这个地区与老师讨论问题,也可以与其它同学互相讨论。

本课程的内容设计方法,能够有效的引起和维持学习者的兴趣。

(2)功能设计

导航:导航功能设计的如何直接影响到网络课件的功能和质量,对课件规范化和标准化起到很重要的作用,该功能可控制学习进度,增强交互活动。该课程设置了当前位置导航、章节导航、功能目录导航、知识点导航等。

交互提示:教程提供了多种交互方式,按操作形式分:文本方式、按键方式、链接方式等,使操作过程更接近实际;按交互活动分:人机交互、人人交互。

同步播放功能:利用流式传输技术,服务器将经过特殊方式压缩过的声音、文本、图像、视频多媒体文件打成一个个压缩包,连续、实时传送给用户,在网络上同步播出。在这种方式中,用户只要等待很短的一段时间用来下载一定量的缓冲信息,就可以开始利用播放设备对压缩的多媒体文件进行观看,多媒体文件的剩余部分将边播放边下载。

网络多媒体课件系统是一个基于WWW的自主式异步远程教学的信息检索课多媒体课程开发系统,并且通过Intranet/Internet实现多媒体课件的与分布式存储。

(3)脚本编写

在课件设计中脚本的编写占非常重要的地位,它是设计阶段的总结,又是开发和实施阶段的依据,从内容上看,它是网络课件中教学内容和教学方法的载体。脚本编写可分为文字脚本和制作脚本。文字脚本是按照教学过程的先后顺序,将知识内容呈现方式描述出来的一种形式;制作脚本包含着学习者将要在屏幕上看到的细节,并详细说明各种信息表示的逻辑关系。脚本编写主要内容包括:

①显示信息。指屏幕上将要显示的教学信息、反馈信息。

②注释信息。说明显示信息呈现的时间、位置和条件以及连接要求。

③逻辑编号。显示常常是以屏幕为单位表述的,为了说明它们之间的连接关系,每个显示单位没有一个逻辑编号,以便说明连接时使用。

④媒体、交互信息的表示。为了清楚地表示教学信息中使用的不同媒体(文字、声音、图形或图象等),交互过程中呈现的各种信息,脚本中常常采用不同的符号表示它们。

(4)素材搜集

素材准备是课件制作中工作量较大的一部分工作。这不仅在很大程度上决定着课件的整体质量,而且影响着素材内容是否能顺利地加载到多媒体课件合成系统中,并能完成打包工作。素材主要有:文本、图像、音频、视频。

①静态图象

要求图像素材为.GIF格式,每一幅图像在800×600分辨率下的尺寸为200×200—800×800像素之间。

②音频素材

要求音频素材为CD音质,立体声,采样频率为44100HZ、8位。音频素材主要为语音录音,以.WAV格式存储。录制的声音文件还要在GOLDWAVE软件程序中进行修改,主要进行去杂音、分配合理的停顿时间等处理,并对每句或每段话的起迄时间记录在案。

③视频素材

视频素材从数码相机摄像获取。与音频转换相似,先设置所需的采样频率等参数,选择需要转换的视频文件,其默认的画面大小就是352×288,采样基准频率为350赫兹。这些素材通过PINNAC视频采集卡,转换为计算机可识别的数据文件,然后转换成AVI格式保存。

④文本素材

文本素材为纯文本的.DOC格式,文字素材可通过键盘输入、扫描资料并进行文字自动识别(OCR)处理等方法获得。

素材搜集完毕后,就要把文本、静止图像、音频、视频、动画等媒体内容组合在一起。同步多媒体合成语言SMIL可以把多媒体对象集成到同步表现中。利用SMIL语言,我们研制开发了“流式多媒体文本同步制作子系统”和“流式多媒体同步课件合成系统”,将收集的素材进行同步合成。

文本同步文件的生成:利用流式多媒体文本同步制作子系统,在其屏幕区添加屏幕序号,一屏内容最多13行,在其内容编辑区将文本素材输入或拷贝到此区域,按屏幕内容区的“加入”按钮,即可将文本素材加入到该屏,在屏幕内容属性区根据已经记录在案的每句或每段话的起迄时间,输入某段要显示的文字的起迄时间,然后输出REALTEXT(.RT)格式的文字与声音同步文件。

图像文件生成:图像素材无须压缩和格式转换。

声音文件的生成:.WAV格式的音乐素材需用REALPRODUCER PLUS转成RM格式,以便于流式多媒体素材的合成。

视频文件的生成:保存后的AVI文件再利用REALPRODUCER PLUS工具压缩成RM格式文件,以便于流式多媒体素材的合成。

文本同步文件及其它压缩文件准备好之后,就要利用流式多媒体同步课件合成系统,将这些元素合成为RM格式的同步流媒体播放文件。

3.网络多媒体课件教学环境设计

“流式多媒体同步课件教学子系统”其用户界面如图1所示。

流式多媒体同步课件教学子系统课件以多媒体为主要表现手段,所以其中加入了视频文件使真实图像、原始声音、现场情况等真实地展现在学习者面前,增强了学习者的感性认识,在很大程度上提高了教学质量。

如图1所示页面的右侧是用来播放同步文本内容(即教师的教学同步电子文稿)的区域。页面的左上侧是用来播放同步视频、同步图像以及同步动画的区域。这样利用多媒体的视频、音频材料的时候能够使之与课堂电子文稿同步的话将会达到很好的教学效果。页面的左下侧是课件内容的滚动目录,通过点击目录中的滚动标题可以很容易的在教学内容之间跳转。例如用鼠标点击“EI年刊本编排及著录格式”标题就可以将屏幕右侧和左上侧的演示内容跳转到“EI年刊本编排及著录格式”这一小节,并在Real

-Player控件中开始播放。在页面的下方是用于控制播放内容的控制条。它们可以控制播放的内容快进、倒退、暂停、停止以及播放的音量和屏幕的大小等众多功能。

三、结论

信息检索网络多媒体课件系统根据信息检索课课程的教学目标,结合网络自助教学的特点和要求开发研制,初步解决了信息检索课网上自助教学中的重点和难点。本系统采用图文并茂的方式,真实再现课程内容,跳跃式学习方法,使学生寓学于乐,克服了自助教学中学生脱离了教师便无所适从的较大障碍,解决了网上教学中自助教学的难点。同时启发提示教学内容凝聚了教师多年丰富的教学经验,充分发挥了教师的主导作用,通过课件引导学生完成自助教学中难以达到甚至无法达到的教学目标,大大减少了教师在课堂教学中的工作量。

总之,该课件系统是采用网络多媒体技术研制的文检课教学课件,它体现和贯穿了素质教育思想,注重学生的知识与能力的协调发展,有利于提高当代大学生的综合素质。

网络信息检索论文:凌波多媒体网络教学系统在高职院校信息检索课中的应用

【摘要】高职院校信息检索课是实践性很强的方法技能课程,教学中通常是先在教室集中上理论课再到机房上实践课,不利于学生很好理解、及时实践和巩固。将凌波多媒体网络教学系统直接应用于课程的理论和实践教学中,把理论课和实践课有机结合起来,利用教师机对学生机的广播、监控、语音教学等操作,可做到老师边讲授学生即时练习当时掌握,实现广播式、集体交互式、个别化和分组等多种模式的教学。

【关键词】高职院校;信息检索教学;凌波多媒体网络教学系统

1.引言

信息检索课是一门融图书馆学、情报学、计算机网络技术知识为一体的技能方法课,是培养学生的信息意识和信息运用能力的主要途径,具有“授人以渔”的功效[1]。而高职院校培养的是具有一定理论知识和较强实践能力,面向基层、面向生产、面向服务和管理及时线的实用型、技能型专门人才[2]。可见,高职院校的信息检索课应以理论够用、适用为度,突出实践性,注重精讲多练。而目前很多高职院校的信息检索课还是使用传统的教学方法和手段,大部分是先在教室集中上理论课再到机房上实践课。理论课则是以教师讲座为主,有的教师也采用了现代化的教学手段,但一般仅是以大屏幕演示PPT的方式为主,即老师在台上针对于某一具体的数据库,进行某一具体问题的演示操作,把检索步骤与过程,甚至结果都一一演示出来。学生则在台下跟着老师的思路一步一步走,或自顾自看书,处在一种似懂非懂、爱听不听的状态。而理论和实践的间隔时间往往偏长,学生即使在理论课上听懂了,相隔几个星期后再去上机实践时已忘得差不多了;再加上学生多,网速慢,老师指导上机时很难做到及时、。这样,学生所学的知识不能很好理解、及时实践和巩固,难以达到理想的教学效果。笔者将凌波多媒体网络教学系统应用于信息检索课,直接在机房中开展教学,将理论教学与实际操作教学有机地联系起来,把教师演示与学生实践有机地结合起来,利用教师机对学生机的广播、监控、语音教学等操作,开展直观、动态和交互式的教学,做到老师边讲授学生即时练习当时掌握,让学生学以致用,融会贯通,取得了良好的教学效果。

2.凌波多媒体网络教学系统简介与安装

2.1 凌波多媒体网络教学系统简介

凌波多媒体网络教学系统是一套基于纯软件设计的网络教学软件,利用机房的局域网环境,实现基于文本、图像、声音、视频、动画等多媒体的同步教学。该系统具有良好的屏幕广播速度,特别适合多媒体课件的教学;语音方面采用音频混合技术,支持多人会话,如同真实的课堂讨论一般;影音广播不仅支持VCD、MPEG,还支持AVI、WAV等多种影音文件格式;独创的缩略图显示方式,全部学生的电脑屏幕尽现眼前;无功能限制、无节点数限制,可以安装任意多台学生端。先进的并发运行制作,各功能可以任意组合,随心所欲[3],为教师提供全新的教学模式,从根本上改变并促进师生之间的信息交互、资源共享和教学合作,实现真正意义上的教与学的交互。

2.2 凌波多媒体网络教学系统的安装

2.2.1 教师端的安装

凌波多媒体网络教学系统采用了类似传统意义上的“服务器—客户端”的配置模式。在机房全千兆局域网的网络环境下,在一台电脑上安装软件中的教师端程序,把这台电脑固定下来供老师上课时进行演示、辅导和管理[4],即为教师机。

2.2.2 学生端的安装

任选另外一台电脑安装软件中的学生端程序,在教师端和学生端程序配置正确、调试无误的基础上,利用机房硬盘保护卡将其余准备作为学生端的电脑唤醒,把安装好学生端程序的电脑作为发射机,进行网络拷贝,待学生端程序传输完毕之后,就建立了基于“教师端—学生端”模式的多媒体授课环境和教学平台。

2.2.3 设置注意

为更好地达到教师与学生的教学交互,在进行教师端和学生端设置时还应注意把模式中颜色质量设置为增强色(16位),使屏幕广播效率较高;在“系统设置”对话框把“发送数据速率”调整为慢,避免学生端接收屏幕画面时出现丢失现象;将学生端程序中“举手”、“发消息”、“交作业”等权限开启。

3.高职信息检索课教学中凌波多媒体网络教学系统的应用

在信息检索课教学时,教师首先启动教师端程序,进入教师端窗口。而学生启动电脑后,学生端程序自动运行,受控于教师端。教师可以根据教师端软件所提供的丰富的功能,利用系统独创的并发运行设计,任意组合各功能,实现相应多样化的教学环节。教师端界面如图1所示。

3.1 利用屏幕广播、电子画板等功能,轻松实现各种教学展示与示范

凌波多媒体网络教学系统的屏幕广播功能可以实时传送教师或某个学生的电脑画面到某组或全体学生的电脑屏幕上,教师可利用这个功能将各种文本、视频、音频、动画等多媒体课件和各种检索操作过程屏幕广播到学生机,轻松实现各种讲解与示范。比如在教学搜索引擎的利用的时候,我既制作了静态的PPT,又利用Camtasia记录了检索的屏幕动作,包括影像、音效、鼠标移动的轨迹、解说声音等,还当场演示了各种搜索引擎的实际操作过程。在讲解过程中还同时使用电子画板功能,把电脑屏幕作为黑板,直接在屏幕上边将边写写画画。多种形式的屏幕广播方式供学生实时地、清晰地观看到效果。教师还可以把任意一台学生机的屏幕广播到其他学生机,既可以给大家展示某个学生的练习情况,进行及时的点评,也可以抽查某个学生进行操作演示甚至讲解,反学为教,既达到了了解学生掌握程度的目的,又可以供其他同学吸取经验和教训。整个教学过程,学生既可清楚地看到教师机或某台学生机的相关内容,又增强了师生的交互,让学生地参与学习过程,真正成为课堂的主角,比教室里单一使用多媒体投影屏幕或请学生上讲台演示操作的效果更好。

3.2 利用远程控制、声音广播、双向对讲等功能,实现个别化的教学和针对性辅导

系统的屏幕监控功能可以让教师随时监看和监听某个学生的信息,了解该生的练习情况,然后利用声音广播、双向对讲等功能对该生进行个别语音指导,必要的时候还可以通过远程遥控对该生的电脑进行操作,开展“手把手”式的指导,进行单独的交互式辅导教学。这种点对点的个别语音指导和远程遥控也可以指定某两台学生机来进行,以此开展学生间互助式的学习,提高学习效率。

3.3 利用班组管理、多人会话、网上聊天等功能,实现分组式的教学与辅导

系统的班组管理可以对所有学生进行任意分组,便于分组练习与指导。教师端软件预设了十一个组,教师可以通过分组列表窗口选择组。“全体”组含义是全部学生,教师只能对其他十个小组进行小组成员的添加或删除。通过这种方式,教师可以针对不同专业、不同程度的学生进行分组,分别建立班组模型,有侧重点的进行干预和辅导。高职院校的信息检索课大多以公选课的形式开展,以笔者所执教的广西机电职业技术学院为例,信息检索课属于全院公选课,学生有来自不同的专业,甚至不同的年级。在教学中,我根据不同的课程内容对学生进行分组。比如讲计算机检索基本理论的时候以全体组来开展,讲数据库的使用的时候以系部分组来练习,讲信息检索策略的综合应用时则以年级分组来进行。这样的教学针对性更强,辅导更到位。

同时,系统采用音频混合技术,支持多人同时用语音进行交谈,教师可以综合利用系统的多人会话、网上聊天功能,指定某个组的学生(包括教师)之间进行语音交流或文字交流,开展分组学习和讨论。比如在进行期刊数据库的检索与利用的练习中,我按专业群布置学生不同的检索任务,要求学生查找自己专业群的相关课题,并形成检索报告。我先将学生按系部分组,按组将学生机的屏幕画面同时显示在教师端,让自己对每一组学生的练习情况一览无余。然后根据各组学生练习的情况,向各小组用语音或文字广播他们检索课题的检索策略、方法等关键问题,进行窗口遥控辅导,或者直接对各组进行遥控操作。有时还组织分组讨论,教师可以随时加入任何一组参与讨论。也可以随时根据各组练习情况将某个学生的荧屏显示和语音等信息,向该组甚至所有学生广播,进行展示或讲评,以便学生学习他人的经验,调整自己检索策略和方法,提高学生的检索能力。

3.4 利用屏幕日志、提交文件等功能课后检查学生的学习情况

系统的屏幕日志功能,可以自动把全体学生机的电脑屏幕画面,以jpeg图片文件格式,保存到教师机指定的文件夹中,便于无人值守或事后查看学生电脑的使用情况。系统还有方便快捷的提交文件和传送文件的功能,学生可以把练习结果提交到指定的文件夹中。由于每一次课的时间有限,课堂指导不能面面俱到,所以课后我经常调出自动保存的文件或学生提交的练习,继续了解学生上一节课的练习情况,分析学生对知识、技能的掌握程度,便于下一次课有针对性的复习和巩固,提高教学效果。

3.5 利用屏幕监视、锁定电脑、点名签到等功能,实现课堂的有效管理

系统设置有点名签到功能,便于教师考勤。同时有锁定电脑功能,如果教师在讲课过程中通过屏幕监视发现个别学生机擅自脱离了控制,在玩游戏或随意添加删除程序的,可以立即将其电脑锁定,强制其停止当前操作,或者将其显示器屏幕设置为黑屏,提醒学生注意听讲。如果在自主练习中发现有学生未按要求练习的,则可以通过点对点或点对多给这些学生机发送提醒消息,这样充分保障了学生的学习质量,实现了课堂的有效管理。

4.高职信息检索课教学中应用凌波多媒体网络教学系统的好处

4.1 安装简单,操作简洁,好用易学

高职院校的信息检索课程教学大多由图书馆馆员兼任,他们的电脑应用能力普遍较弱。但凌波多媒体教学系统纯软件实现,不需要服务器,安装简单,升级维护方便,且硬件兼容强,对所有的网卡、声卡及显示卡都能体现出良好的性能,具有极强的系统稳定性,保障教学过程的顺利进行。同时,系统的各项功能完善,使用统一的操作模式,直观简洁、易学易用,不同电脑知识基础的图书馆馆员都可以自如地操作,顺畅地开展教学。

4.2 边讲边练,学生当堂掌握所学知识

屏幕广播功能可以随时打开、停止,切换方便。教师用屏幕广播讲完一个知识点或演示完一种检索方法,马上停止广播,把学生机的操作权放给学生,开始操作练习。教师可以通过教师端显示的学生机屏幕缩略图通览每台学生机的操作情况,再根据学生的练习情况进行文字、语音辅导,或者把任意一台学生机的操作屏幕向全体学生机广播,进行点评或展示;也可以重新打开广播,继续知识点的讲解。整个教学过程操控自如,讲练结合,实现当堂讲授、实践、辅导、掌握和巩固,各教学环节学生都充分参与,学习兴趣贯彻始终。

4.3 教学功能灵活组配,便于开展多种教学模式

凌波多媒体网络教学系统丰富的教学功能可以进行灵活组配,随心所欲。既可以利用系统的广播功能完成班级集体授课,也可以通过点对点、点对多的操作与学生交流;既可文字交流,也可语音交流,兼顾了广播式、集体交互式、个别化和分组教学四种教学模式,开展更适合高职学生特点的课堂教学。

4.4 教学管理功能齐全,保障课堂教学管理质量

系统齐全的教学管理功能,既实现了课堂的自动考勤,又可以限制学生对电脑的使用权限,避免学生机脱离教师端控制,使学生专心听课。还可以保存学生机的操作屏幕,便于无人值守和事后查看每个学生的操作情况,更有稳定的提问、收取和提交作业功能。这些,既方便了课堂管理,保障了教学质量,也为平时成绩的评定提供了很好的依据。

5.结语

实践证明,将凌波多媒体网络教学系统应用于高职院校的信息检索课教学,将实际操作与理论知识教学结合起来,利用其交互作用,充分调动学生的积极性、主动性和创造性,通过动脑、动手、动口,使学生积极、主动、较大限度地参与到教学过程中,让课堂充满活力,充分体现学生在学习活动中的主体作用。同时,可以使教师由一个说教者成为教学的管理者和组织者,学习的引导者和帮助者,使信息检索课密切结合高职院校独特的人才培养目标,切实提高学学生的信息素养。

网络信息检索论文:泛在网络环境下改革信息检索课教学

【摘要】在泛在网络环境下,信息检索课教学面临前所未有的机遇和挑战。信息检索课有可能采取移动教学这种新型的教学模式。本文分析了信息检索课开展移动教学的必要性,并提出了信息检索课开展移动教学模式的思路。

【关键词】泛在网络;信息检索课;移动教学

在泛在计算提出以后,日韩等国先后提出了泛在网络。顾名思义,泛在网络即是指无所不在、无时不在的网络[1]。随着网络泛化的发展,3G 网络的成功运用,以及移动手机的普及,信息检索课的教学内容和实践平台都发生了重大变化。为了适应网络泛化的紧迫形势,移动教学或许将成为泛在网络环境下信息检索课的主要教学模式。所谓移动教学,指的是基于网络环境、借助移动通信技术、移动通信终端进行的随时随地的教学活动[2]。

1.信息检索课开展移动教学的必要性

1.1 信息人群的现实需求

随着互联网成长起来的新一代用户,是信息服务的主要群体,他们的信息需求频率很高,更热衷于使用网络,并且多数人上网的时间长、频率相对较高,对网上信息资源也是持肯定的态度。根据中国互联网络信息中心(CNNIC)《第28次中国互联网络发展状况统计报告》,截至2011年6月,中国网民规模达到4.85亿,且较大的网民群体是学生,特别是手机网民年龄呈现偏态分布,主要集中分布于10-29 岁的人群。与整体网民相比,年轻人更多热衷于手机网,尤其是在线阅读、手机阅读、手持式阅读器阅读等数字媒介阅读已开始普及[3]。可见我们已经进入了全新的网络生活。

1.2 更新知识的需求

美国学者托布斯认为,未来的文盲不是不识字的人,而是不会学习的人。因为据统计现在的大学生一出校门,所学知识的50%就已经老化。为了适应竞争激烈的社会,每个人需要不断更新自己知识,那么谁掌握了知识和信息上的新鲜度,谁就获得了生存和发展的优势。在泛在网络时代,基于3G 网络的信息检索课移动教学正好符合人们的这种需求,通过帮助学习者随时随地获得不断更新知识、创新知识的能力和方法,来抗拒日益严重的知识老化现象的出现。

2.泛在网络环境下开展信息检索课移动教学的思考

移动教学是基于互联网、3G 移动网以及移动终端实现的交互式的教学活动,所以信息检索课移动教学系统主要由互联网、3G 网络、移动终端、教学交流平台构成[4]。

2.1 已具备开展移动教学所需的网络环境

随着三网合一步伐的加快,3G进入规模化发展阶段。截至2011年,中国电信、中国移动和中国联通三家基础电信企业共完成3G专用设施投资941亿元。3G基站规模达到79.2万个,3G网络已覆盖所有城市和县城以及部分乡镇。11月末,3G用户达到11873万户,比年初新增7168万户[4]。因为高传输速率是3G 的较大优势,它拥有足够的带宽,在室内、室外和行车的环境中能够分别支持至少2Mbps、384kbps 以及144kbps的传输速度53Mbps,这个速度比一般家庭固网1-2Mbps的速度都要快,足够在线观看视频讲座(流畅观看视频信息所需要的速度约为100Kbps)。所以只要3G 网络覆盖的地方,学习者都能够利用个人信息终端,接收教师发送的所有教学资源,实现真正的移动教学。泛在网络正是开展信息检索课移动教学的基础。

2.2 已具备开展移动教学所需的移动终端

能够处理更多的数字化信息的移动终端,主要包括3G手机、PDA、上网本等,通过数据库商、图书馆等信息服务机构与移动通信网络结合,可以建立起与读者之间的即时交流的信息网络。特别是3G手机终端用户的普及,利用手机学习、娱乐已逐渐成为共识,且应用领域和使用范围越来越宽广。在教育领域中,从师生之间、学生之间的语音通话、短信互动、家校通、及图书馆信息管理的一些手机推送服务等,利用手机辅助教学已成为教育领域的一个前沿[5]。据工信部数据显示,2011 年底,移动电话用户已达到9.97 亿户。这些数据表明,手机终端具有广泛的群众基础,因此开展手机移动教学这种方式更容易推广。

2.3 足够丰富的数字化教学资源

检索课应该紧紧抓住时展的脉博,将教学内容不断更新,科学编排,形成系统完整的课程体系。

借助移动公司的手机短信互动平台发送上课及培训信息,使学习者了解授课信息,合理安排工作与学习。利用手机短信互动平台实现同步微播教学内容,使不能参加现场上课的学习者,同步了解授课内容及教学进程。增加手机短信互动平台,随时随地地更好的满足读者的需求。整合网络教材、电子图书、多媒体课件、数据库商培训课件、信息检索课教学网站、国家精品课程资源,设计信息模板,建立课程在线管理学习平台。现在的一些数据库商已提供手机阅读查找文献链接,如IEL增设移动访问功能

网络信息检索论文:网络信息检索影响因素及策略研究

【摘要】网络信息检索因其独特的检索特点越来越普遍的为广大信息用户所应用。然而,网络信息检索存在许多影响因素,这些因素影响了信息检索效果。减小这些因素的影响,提高信息检索效率,是信息用户必须解决的问题。本文就提高网络信息检索效率提出四大网络信息检索策略,并对每个检索策略进行了详尽的描述。

【关键词】网络信息检索;影响因素;检索策略;信息菜单;信息斑块

网络信息检索一般指因特网检索,是通过网络接口软件,用户可以在终端查询各地上网的信息资源[1]利用网络信息检索,信息用户可以获得任何类型的即得信息,为他们科研、学习、生活的需要提供相应信息素材。然而,众所周知,网络信息是海量的、复杂的、无章的。怎样从浩如烟海的网络信息资源中有效而快捷的检索到即需信息,成为信息用户迫切需要解决的问题。寻找或者掌握合适的网络信息检索策略是解决这一问题的关键所在。

1.网络信息检索的特点与不足

1.1 网络信息检索的特点

网络信息资源检索系统是基于Internet的分布式特点开发和应用的。与传统的信息检索(如手工检索、联机检索等)相比,网络信息检索有其自身特点,主要表现在以下几个方面:

及时,必须借助网络检索工具。网络检索工具即Web检索工具,是指提供网络信息资源检索和导航服务的一类专门网站或服务器。[2]网络检索工具对采集到的网络信息进行分析、加工和整理,建立应用索引数据库,为用户提供网络信息检索服务。

第二,基于超文本结构。超文本是一种用户界面范式,它是将自然语言文本和计算机交互式地转移或动态显示线性文本的能力结合在一起的文本管理工具。[3]网络信息检索系统利用了超文本的技术特性,对网络信息进行交叉联想方式存储,从而使得在internet上检索信息方便灵活。

第三,检索方法的多样性。由于网络信息检索系统具有交互式操作和程序员接口,所以其势必拥有较多的检索方法。例如:在线目录浏览、关键词(主题词)检索、布尔逻辑算符检索、位置逻辑检索、字段检索、截词检索等。

第四,多媒体检索。随着信息技术的发展,网络信息呈现图形、图像、声音、视频、动画等多媒体化。网络信息检索系统基于文本的技术和基于内容的技术,把这些信息聚类并建立索引,从而在internet上实现基于多媒体内容的信息检索。

1.2 网络信息检索的不足

网络信息的复杂性和网络检索技术的限制,使得网络信息检索也有着明显的不足:

及时,信息筛选能力有限。网络信息检索返回的信息数量巨大,用户面对这些松散的未组织信息,常常会无所适从。如果网络信息系统能够进行有针对性的信息筛选工作,那将会给用户节省大量的时间和精力。

第二,信息有用性评价困难。由于因特网没有一个统一的管理机制,信息自由度高,这就造成信息良莠不齐,真假难辨。网络用户对获得的信息的有用性评价十分困难。比如,一些站点在网页中大量重复某些关键字,使得容易被某些著名的检索引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息。[4]

第三,信息资源更新频繁。用户总是希望得到近期确切的信息,然而网络信息分分秒秒在更新,即时检索存在不可能性。即使是刚刚浏览过的信息,再去浏览时也有可能已经更新、过期,甚至被删除。

2.网络信息检索影响因素

网络信息检索的影响因素有很多方面。在诸多因素中,有四个因素主要影响着不同检索策略的选择和应用,从而影响网络信息检索效果。这四个因素是:信息用户目标和任务、信息用户知识结构、IR系统设计和社会和组织背景。

2.1 用户目标和任务

用户信息需求和需求表达是用户网络信息检索的目标和任务,是网络信息检索的始点,它会影响到网络信息检索策略和网络信息检索效率。由于自身的信息能力、专业知识、理解水平等原因,用户不一定能意识到自己真正的信息需求。用户任务处于不同检索阶段将影响其检索策略的选择、用户行为和感知,也决定着检索技巧、关键词选择、信息类型、相关标准的选择。用户所在的阶段越关键,越应使用更的检索关键词,更多的运算符和技巧。在整个检索过程中,用户对问题描述的清晰度将会影响用户检索结果。

2.2 用户知识结构

高效地网络信息检索需要三种不同的知识类型:领域知识、IR知识、系统知识。其中,领域知识帮助用户对检索任务和需求有更深的了解,影响检索行为、策略和表现;IR即信息检索(Information Retrieval,简称IR),IR知识帮助用户形成观念策略和执行策略,;系统知识帮助用户选择有效检索系统,让策略执行的更顺畅、检索效果更,系统知识要求信息用户必须具备一定的计算机知识和网络信息检索知识。毫无疑问,有经验的用户会比没经验的用户利用更好的检索策略和实现更佳的检索过程。

2.3 IR系统设计

在网络信息检索过程中,IR系统设计也是一个重要的因素。系统中信息资源的组织、分类是否科学、检索方式是否多样化、智能化、界面设计是否科学等因素会直接影响到检索的效果。比如系统所提供的界面是否容易理解、是否能让用户快速寻找到完成任务的功能区域,是否随时为用户提供帮助等等。[5]由此可见,IR系统的设计无疑会影响用户检索策略的选择。作为用户网络信息检索过程的伙伴,IR系统,尤其是IR系统界面,直接决定用户应用某种特定策略的多寡。IR系统特定功能的可用性决定着用户是否专注于某种策略。

2.4 社会和组织背景

根据用户信息检索所处的特定环境,可以将社会和组织背景因素分为信息用户所在的组织环境、信息服务商提供的服务环境(当这种服务环境以系统比如网上咨询服务的形式体现时,该环境与系统因素有一定的交叉)以及国家政府大环境。[6]组织自己的关于任务解决的规则、组织中其他人已有信息行为都会在不同层面影响个体信息用户的信息检索行为;IR系统提供商的服务环境、其它服务环境(用户检索知识培训学习、信息资源介绍、导航服务、权限设定等)对用户信息检索的成功与否也有着不可低估的关系;作为社会大环境,国家的信息政策,信息产业的发展,一直到信息资源的整体配置水平都会在很大程度上影响微观的信息消费活动乃至信息检索行为。

3.网络信息检索的几大策略研究

3.1 选择最有利网络信息源

网络中有多种多样的信息源,其质量、丰度和分布格局等各不相同并具有一定的规律性。信息用户在检索信息时需要耗费时间、资金和精力等稀缺资源,这就面临着信息源选择的问题:如果选择范围过窄,信息用户就可能需要花费更多的时间来构建检索式,从而增加检索结果的片面性;如果选择范围过宽,信息用户就可能会被检索出来的信息再次淹没。信息用户由于受时间、资金和精力的限制,选择何种信息源将对其信息获取效率起着重要的作用。

信息用户在检索和吸收信息过程中,需要消耗时间、资金和精力,才能获得所需的信息,同时也获得一定的信息净收益,用公式表示为:

信息净收益=信息总能一检索耗能一加工处理和吸收耗能

信息净收益与信息处理时间之比值是衡量信息源有利性的一种尺度(其中信息处理时间是指从检索到吸收所花费的时间)。信息行为学研究发现,信息用户在信息检索活动中总是选择有利性更大的信息源,尽量选择那些能够为其带来较大信息净收益的资源。对信息用户进行信息检索来说:选择费用较高的信息源,需花费较多的资金,但单位检索时间内所获得的信息净收益较高;选择费用较低的信息源,花费资金较少,但单位检索时间内所获得的信息净收益较小;选择费用适中的信息源,单位检索时间内提供的信息净收益几乎是较高的。所以,信息用户选择费用适中的信息源其有利性较大。

3.2 选择最适信息菜单

信息菜单是指信息用户在信息检索过程中,选择检索的信息类型的集合。[7]信息用户在信息检索活动中,假设已选定信息源。如果信息源中最有利的信息的密度小,则信息获取率低;有利性较小的信息密度大,则信息获取率高。在这种情况下,信息用户必然要选择部分有利性较小的信息。在既定信息源中选择部分有利性较小的信息,就必须使信息菜单选择范围扩大。如何调节两者间的矛盾,即在网络环境下信息用户的信息菜单应在多大程度上包括一些有利性较小的信息资源类型呢?国外学者对此进行了深入的调查和讨论,分别提出了人的最适信息菜单构成要素,其要点为:①如果有利信息的可获得性增加,那么最适信息菜单中的信息类型会减少;②信息用户在信息检索过程中,检索辨识时间和信息的平均有利性将随着信息菜单范围的扩大而减少;③根据信息的有利性和检索辨识时间,可以推测最适信息菜单中应包含的信息类型。由于对信息获取效率的需要,人单位时间内所摄取的信息能量应该尽量维持在一定的水平。[8]由此可以推测:①如果与有利信息相遇的机会较多,而足以使信息检索者忽略较差的信息,那么无论较差信息的数量有多少,都不会影响信息检索者对有利信息的专一选择;②如果有利信息数量增加,信息检索者会立即从检索多种类型的信息,转变为检索单一的、有利的信息;③假定人一直是检索最适信息菜单范围内的信息资源类型,现在遇到了两种新型信息资源x和y,若检索信息资源x时,单位总处理时间内所摄取的信息能量高于满足人的信息需求的信息数值;检索信息资源Y时,单位总处理时间内所摄取的信息能量低于满足人的信息需求的信息数值,则人总是要检索信息资源X,而拒绝检索信息资源Y。

网络信息环境下,信息用户的最适信息菜单中还应包括某些特定的信息或特定的信息元(如某些数据信息、事实信息及图片信息等),这些特定信息或信息元是满足人的信息需求所必需的。对这类信息的检索,不以信息能量净收益为目的,而以满足增加人的知识或人改变知识结构需要为目的。另外,信息用户的最适信息菜单通常随信息需求和网络信息环境的变化而变化。

3.3 选择最有利信息斑块

信息斑块是指信息环境中信息资源丰度较高的集合体,它只是一种物理学意义上比喻,可以将它看成是一个网站、一篇论文、一本书、一个网页、一个文档集合。正如选择最有利的信息源一样,网络环境下,信息用户也会寻找最有利的信息斑块进行信息检索。[9]

信息用户的信息检索活动通常会导致信息斑块中有价值信息的“减少”,或需要花费更大的代价才能获取有价值的信息,使信息斑块的可利用性随着时间而“降低”。因此信息用户要选择在适当的时间停止信息检索行为,或在花费较少费用或克服较低的技术问题情况下,转移到另一信息斑块继续检索信息。是什么机制使信息用户在恰当的时间,从一个信息斑块转移到另一信息斑块呢?信息用户在信息斑块内检索信息的去留是由放弃时间所决定的(放弃时间是信息用户从一次获得有用信息到下一次获得有用信息所能等待的最长时间)。在信息密度足够大的信息斑块内,两次信息检索时间间隔较短,不会超过放弃时间,因而信息用户不会转移;但随着有价值信息密度的减小,两次获得有用信息的间隔时间就会逐渐延长,一旦超过了放弃时间的限度,信息用户就会放弃这个信息斑块,转移到另一个信息斑块继续检索。放弃时间的长短与检索辨识信息时间和转移所需费用、信息检索的难易程度有关,在数值上等于从一次获得有用信息到离开这个信息斑块所经历的时间。在信息用户的“内置”信息检索机制中,可能有一个相对固定的放弃时间,好像在每次信息检索之后就上好一个闹钟,到时未能检索到信息就转移离开。

3.4 选择多点检索信息行为

多点检索信息是指信息用户在网络上并不局限于在一个网站上检索信息,而是采用在多个网站上检索信息的策略和行为。在检索信息过程中,用户离开某一网站很容易,但要找到好的网站并不容易。当用户期望的具有大量信息的网站很容易被找到时,他们就不再热衷于留在一个网站来检索信息。从经济学角度分析,信息用户在选择最有利的信息斑块时,必定会借助于行为适应来减少信息检索投资和提高信息检索效率。当信息用户到达一个陌生的信息环境进行信息检索时,通常会借助信息取样检索(试检索)行为获得信息环境中各信息斑块状况的信息,并根据这些信息做出最有利的信息检索决策。一般来说,信息用户主要集中在信息密度较大的信息斑块内,当最有利信息斑块质量下降时,信息用户会转移到第二较有利的信息斑块继续检索信息。另外,信息用户通常也借助于以往的网络上浏览或某一次的信息检索行为,不断积累有关网络上各种各样信息资源的信息丰度的认识,并且能够把获得的各个信息斑块中相对有利的信息储存起来。

在实际网络信息检索中,信息用户可以综合运用网络信息检索策略,以期提高信息检索效率,达到性价适宜的信息净收益。

网络信息检索论文:数据挖掘及其在网络信息检索中的应用探析

摘 要 本文通过对数据挖掘的概念方法出发,探讨了数据挖掘在当代网络信息检索中的应用。分析了数据挖掘与信息过滤和可视化技术的结合,进而提高网络信息的检索效率,弥补现有检索工具的不足。

关键词 网络信息挖掘 数据挖掘 网络信息检索

一、 网络信息资源及其特点

所谓网络信息资源就是指网络上能够满足用户信息需求的资源的集合。可想而知,网络信息资源相当的丰富,各方面的都有,其内容涉及到世界上的每一方面,例如:农业、文学、航天、地理、医疗、计算机、法律、娱乐界等几乎所有专业领域,网络资源是知识和信息的集合,是一批非常宝贵的财富。而目前的网络信息资源与传统的不同,以成为一种新型的数字化资源。网络信息资源的特点主要体现在以下几个方面:

(一)信息数量庞大、种类繁多以及传播范围比较广。网络信息类型呈现多样化,主要有文本、数据、图文、图像、音频、视频等信息;其内容也不是单一的既有健康的信息,也少不了有害和虚假的信息,从个人到政府都有一定量的信息。

(二)目前网络信息资源管理机制多样,没有统一的机制,以至于网络信息安全缺乏一定的保障。于是就出现了普遍存在的黑客、计算机病毒和色情信息。国家花费了大量的社会资源来防止有害信息的传播。

(三)由于科学技术的不断发展造成了网络信息资源更新数的极快,在网络信息管理方面就比较困难。网络信息属于自由,因此信息来源广泛,内容呈现出多种多样,质量也就没有了保障。

(四)网络资源较大的优点是它给用户提供了多层次的信息交流模式,反应了当今社会生活的各个方面,形成了网络的百科全书和具有快速的传播功能。

二、网络信息挖掘的类型

(一)网络信息的内容挖掘。

网络信息的内容挖掘就是从网络中存在的内容、数据中发现出对自己有用的信息。网络信息资源类型繁多,其中大量的网络信息资源可以通过在网络中的索引和检索服务直接获取,但是还有一些网络信息是通过一些工具或方法获取,如用户通过提问而动态生成的结果就属于此类信息。还有一些私人网络数据,它们不能够通过就不能通过索引收索出来。另外,网络信息内容是由文本、图像、音频、视频和数据等形式的数据组成的,由此可见网络内容挖掘是一种多媒体数据挖掘形式。

(二)网络信息结构挖掘。

网络结构挖掘是从Web文档结构、WWW的组织结构和链接关系中推导的。网络信息结构挖掘的目的是寻找Web和页面的结构及其蕴含在这些结构中的有用模式,然后对其链接进行合理的分类,通过不同网页的关联有助于用户找到所需信息的相关资源,并且可以通过浏览特定的网页从中获取近期的动态信息。还可以发现Web文档本身固有的结构,此种结构既可以拥有用户的浏览,也可以对网页进行比较。

(三)网络信息用法挖掘。

通过网络信息用法挖掘,可以充分的了解用户的网络数据实际意义。网络信息内容挖掘和网络信息结构挖掘主要是针对原始数据的,而网络信息用法挖掘主要是针对用户和网络交互的过程中产生的数据。这些数据类型包括很多:用户对网络服务器的访问记录、浏览器日志记录、用户的个人信息、用户额交易信息等等。运用网络信息用法挖掘技术能够有效的从服务器以及浏览器端的日志记录中发现隐藏在网络数据中的一些无法通过索引获取的模式信息,还可以了解用户对网络系统的访问模式以及在网络上所进行的行为模式,从而对其作出预测性分析。

三、网络新挖掘在信息检索中的应用

网络信息挖掘的作用除了体现在具有很大的网页的生成上外,还可以通过Web的组织结构和链接关系中发现一些其他类型的知识。网络信息挖掘可以通过挖掘web的结构信息揭示蕴含在web内容之外的许多隐含的有用信息,例如web页面上的U不仅可以反映页面的类型,还可以在一定程度上反映页面间信息的存储位置和不同信息内容的层次关系以及通过分析网页的URL来分析这种层次关系。根据上述原理已有很多人提出了与web页面URL有关的启发式规则,并将其应用于寻找个人主页上。因此,利用网络信息挖掘可以很快的寻找个人主页和与其相似的网页。除此之外,web的信息挖掘还可以对web页进行合理的分类,预测用户的链接使用及链接属性的可视化,对各个企业搜索引擎索引的web页数量进行统计分析等。它也可以揭示文档结构信息中的有用模式,有助于从多个维度和层面提供检索途径。

四、结束语

因为信息时代的发展,促使网络信息挖掘成为网络信息处理领域中的一项新技术,它可以使用户通过大量网络信息中,得到数据对象间的内在特性,并根据数据间的关联在网络资源中进行有目的获取相应的信息。目前网络信息挖掘是数据挖掘技术在网络时代网络信息处理中的一项非常重要的应用,同时也是今后网络领域中的一项崭新的研究课题。随着网络的快速发展和不断的普及,网络信息资源不但来源途径更加广泛而且内容也越来越丰富,但如何分析和利用这些无以计数的网络数据是当前比较突出的一个问题。网络信息挖掘在实际工作中具有重要的实践意义和非常广阔的应用前景。

网络信息检索论文:网络环境下信息检索课教学模式探讨

摘要:本文利用多媒体同步技术在网络环境下的优点,将其应用到信息检索课网络教学模式中去,为学生提供了自主学习、交互式的教学新模式,很大程度上调动学生的学习积极性,提高了教学质量,大大促进了信息检索课教学的发展。

关键词:信息检索课;多媒体;教学模式

“信息检索与利用”是国家教育部于1984年(004)及l992年(044)两次发文要求全国高校本科生、研究生开设的一门公共课程。教育部从1998年正式启动我国的现代远程教育工程。虽然各院校信息检索课教师在这方面做了一些必要的有益尝试,制作了一些CAI课件,综观这些文献检索课件,普遍存在以下问题:①多以HTML文本或POWERPOINT格式显示授课内容,教学内容难以同步、内容单调;而且用户可以随意下载课件内容,容易侵害制作单位的知识产权。②有些多媒体课件采用VOD(视频点播)技术,但存在因网络带宽限制而出现延迟过长和存储空间不足的问题。③课件开发的难度、复杂度和课件制作的成本较高。④信息检索课教学内容的更新缓慢。因此运用新型的网络多媒体技术,编制出符合教学实践需要、受学生欢迎的多媒体课件,并将网络课件通过Internet的链接,使学生可随时上网学习,不仅将提高信息检索课件的制作效率与质量,而且将调动学生的学习积极性,提高信息检索课远程教学效果。

一、个性化同步多媒体教学模式

从教育心理学上考虑,获得较好的远程教育课件应该满足下列条件:

1.媒体多元化:在网络环境教学中使用媒体多元技术能够使远程信息的表现形式丰富多彩,利用视听信息来代替只能文本信息,让学生更加容易接受新知识。

2.个性化:在远程教育的教学过程中学生知识结构不同,对新知识的认知也有差别。因此课件内容需要让每一位学生按照自己的需求选择相应学习的方式和进程。

3.教学内容同步:网络环境下学习的效果比不上老师教学的原因就在于学生在课堂上调动了听觉与视觉,在老师的引导下,不断接受老师的声音和板书信息。因此我们在利用各种视频和音频材料的时候,使课堂电子文稿同步的话将会达到很好的效果。

为了达到以上几个目标,我们将课件设计为如下形式:

流式多媒体同步课件教学系统课件以媒体多元化为主要表现形式,加入视频文件使真实图像、原始声音、现场教学情况等地展现在学生面前,增强了学生者的认识程度,提高了教学质量。如上图所示页面的左下侧是本节课件的目录,通过点击目录中的滚动标题可以很方便的在教学内容之间跳转。例如点击“工程索引年刊本编排及著录格式”标题就可以将屏幕右侧和左上侧的演示内容跳转到“工程索引年刊本编排及著录格式”这一小节,并在播放控件中开始播放。页面的左上侧是用来播放同步视频、同步图像以及同步动画的区域。这样利用视频和音频的时候能够使之与老师的电子文稿同步显示话将会达到很好的教学效果。页面的右侧是播放同步文本内容(即老师的教学同步电子文稿)的区域,在页面的下方是控制播放内容的控制条,用其可以控制播放的内容前进、倒退、暂停、停止以及播放的音量和屏幕的大小等功能。

二、同步媒体技术和流媒体技术

1.同步媒体技术。同步媒体技术是指使各种多媒体信息保持播放同步。同步媒体的实现,一般是编写一个时间序列表,对文本、图片、音频、视频文件播放的先后次序作出定义,使多媒体演示内容的各个组成部分可以按照规定的时间序列表实现播放同步。网络环境下老师教学内容点播应用中,需要实现老师的视频音频信息与其讲稿文本的同步播放。为了在网络环境中开发各种多媒体应用,W3C(World Wide Web Consortium)组织推出了同步多媒体集成语言SMIL。SMIL作为一种新型多媒体语言具有很多优点:①组合各种多媒体对象,实现其在时间上的同步;②节约网络带宽;③提供内嵌的超链接元素,支持各种超链接。SMIL是同步多媒体集成语言(Synchronized Multimedia Integration Language)的缩写,它是由W3C组织规定的多媒体操纵语言。近期的SMIL版本是2001年8月推出的SMIL 2.0版本。SMIL与我们网页上用的HTML的语法格式非常相似。后者主要针对普通的网络媒体文件进行操纵(文字、图片、声音、动画、视频的机械堆砌),而前者则操纵多媒体片断(对多媒体片断的有机的、智能的组合)。

2.流媒体技术。流媒体技术也称流式媒体技术,所谓流媒体技术就是把连续的影像和声音信息经过压缩处理后放上网站服务器,让用户一边下载一边观看、收听,而不要等整个压缩文件下载到自己的计算机上才可以观看的网络传输技术。流媒体技术包含多媒体内容的制作、多媒体内容的存储以及相应的传输和播放等信息处理环节,具有实时广播与异步回放(点播)两种应用形式。其中,异步回放也即点播是实现网络教育的重要技术手段。点播系统采用客户端服务器模式,将多媒体内容存储于服务器内,基于实时多媒体通信协议RTP,通过配置媒体流播放插件(Plug-ins)的Web浏览器实现视频点播。目前,在网络环境中点播系统的产品很多,但是各个系统之间相互不兼容。因此,在网络教育应用中,需要首先解决点播系统的选型问题。目前,广泛应用的点播系统是Real Networks公司的RealSystem G2系列和Microsoft公司的Windows Media Technologies。两套系统均提供了一整套制作、和播放工具,其中RealSystem G2系统提供了一个开放协同的、满足多方面应用的解决方案,包括异构操作系统的同步媒体、传输协议和集成框架等。因而,我们选择RealSystem G2产品平台作为网络环境中流媒体技术平台。

三、异步点播教学系统在网络环境下的应用

网络环境下的异步点播教学系统是基于网络的应用。此系统向学生展现了一个功能齐全、操作方便的播放多媒体网络教学课件的教学环境。仅仅需要学生在使用的计算机上安装相应的RealPlayer System软件,就可以使用异步点播教学系统。使用此教学环境,学生可以随心所欲地选择授课的内容,可以实现在授课内容之间的跳转,并可以控制播放的进度(快进、倒退、暂停、停止)以及播放的音量和屏幕的大小等众多功能。

网络环境下信息检索课多媒体教学系统根据信息检索课程的教学目标,结合学生网络自主学习的特点和要求开发研制,解决了信息检索课网上自主学习中的难点和重点。总的说来,主要有如下两点:①信息检索课是一门实习操作课程,本课件系统围绕其特定的教学任务设计,让学生积极参与练习,突出其教学重点,达到了理想的教学目标。②采用媒体多样化方式,点播式学习方法,使学生克服了自主学习过程中无所适从的较大障碍,解决了网上教学中自主学习的难点。

网络信息检索论文:网络信息检索系统的设计与技术分析

【摘 要】当前,随着互联网的普及和网上信息的爆炸式增长,信息检索系统及其核心技术搜检索擎的性能和效率问题已成为人们研究和关注的焦点。影响一个搜检索擎系统的性能有很多因素,但最主要的是信息检索模型,通过对信息检索模型研究的主要内容和构建策略进行了描述,就相关的问题进行了探讨,总结了信息检索模型的研究。

【关键词】信息检索模型;相关性;查询;搜检索擎

随着网络应用的不断普及,网络已经成为人们获取信息的重要场所。在对新的检索工具和检索技术进行探索和研究的过程中,应克服当下网络信息检索给我们带来的困难,加强对不同需求进行信息搜集和发送的智能化服务功能。

一、网络环境下信息检索的含义及特点

智能化信息检索是在信息检索的基础上提出来的,它是以用户为中心的信息检索技术,为不同用户提供不同的服务,并满足同一用户在不同时期的需求,通过收集和分析用户信息来学习用户的兴趣和行为,并综合利用这些用户信息,提高信息检索系统的性能,满足用户的个体信息需求。在具体实现过程中主要是通过观察和分析用户的搜索行为,从中识别出用户对信息需求的偏好,并且能够根据用户对搜索结果的评价,自觉地调整搜索策略,使得对于不同的检索请求,不同用户都能够得到最贴近自己需要的信息服务。

数据量巨大。在网络环境下,数据量大的惊人。大数据量会导致一些难以预料的软件异常,流量也会难以控制,对各个环节的策略和算法选择将会更加复杂。

多用户服务。多用户模式的信息检索服务必须注重快速反应,注重对并发访问的支持,对公共数据的共享,对临时工作数据的清理等。如果要针对不同用户开展不同服务,就要获取并管理不同用户的个性化需求,使大量的信息通过不同的渠道,主动送到用户的手上。

用户层次复杂。网络环境下信息检索服务的用户中,大多数都不是专业用户,他们的层次区别较难,拥有不同的操作技能和操作知识,面对这些非专业的用户,将更加需要人性化的引导式信息服务。

二、网络信息检索的原理

随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模较大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。

网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式:

1.布尔逻辑模型

这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。

2.模糊逻辑模型

它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。

3.概率模型

它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。

三、网络信息检索系统主要功能模块

(一)Oracle数据集成工具(ODI)

ODI(Oracle Data Integrator)是Oracle公司采用ELT理念进行数据抽取、加载、转换的数据集成中间件工具,其较大特点是提出了知识模块的概念。ODI将一些场景(如文件加载到数据库,从MySQL数据库抓取数据到Oracle数据库等)的详细实现步骤使用Jvthon脚本语言结合数据库SQL语句录制成详细的步骤记录下来,形成知识模块,ODI中共有超过100种主流数据库引擎和应用系统的知识模块,基本上包含了普通应用所涉及的所有场景,因此ODI可以实现对校园网内多种异构数据库的支持。在一个数据集成任务中,ODI通过声明设计运用接口和关系图等概念声明数据集成规则,使集成的逻辑和技术层面分离,底层的技术方面由知识模块描述和定义,系统只需要把重点放在集成任务规则的制定上面,再将制定好的集成规则封装为一个服务模型。和订阅该模型便可实现类似于数据增量定时更新的功能,系统以全局数据库为核心通过ODI工具对校园网内异构数据库数据进行抽取、转换、清洗和加载,集成后的数据质量得到了提高,对异构数据源的处理也得到了加强。在对数据处理的过程中提取了信息的标题、作者、正文、时间、URL地址等字段,可定时对各异构数据库数据进行增量更新操作,从而替代利用网络爬虫获取信息数据。Oracle全局数据库可以集成校园网内大部分信息系统的数据并提供给信息检索和检索模块。

(二)Lucene与Nutch

Lucelle不是一个完整的搜检索擎,而是一个用于实现全文检索的软件库,采用Java语言开发,提供了检索内核,其设计原理是检索检索,任何信息资源只要被转换成文本格式都可以被检索。Nutch是Lucene得到广泛应用和认可后出现的搜检索擎系统,内部使用了Lucene的检索检索技术,并进一步封装了网络爬虫和分布式处理等模块从而成为一个完整的应用系统。本系统以Nutch为基础,既应用了Nuteh系统的完整性,减少了不必要的开发,又可灵活使用Lucene接口,丰富系统功能。

对于非结构化文本信息,系统对Office文档采用了POI插件方式,用PDFBox插件来实现对PDF文档的读取,并将上述插件集成到Nutch当中。信息检索的基础是文本分析,而文本分析在很大程度上依赖于分词模块对语言的处理。Nutch自带的CJK分词模块对中文分词的效率和度上不能满足实际需要。为此。在对比了JE分词、Paoding分词和ICTCLAS分词等多款中文分词模块后,Paoding分词由于其开源性和良好的分词效果被本系统采用,并通过Nuteh的插件机制集成到系统当中。

(三)信息检索与检索

为满足用户全网检索和分类分部门检索信息的需要,并提高检索效率,信息检索模块首先对每个数据源建立检索文件提供给分类检索用户,然后通过优化检索提供给全网检索用户。优化检索就是将多个检索文件合并成单个文件的过程,目的是为了减少检索文件的数量,并且能在搜索时减少读取检索文件的时间。Nutch中的IndexWrite类提供了optimize方法实现该优化操作。利用Nutch中的MultiSearcher类可实现对优化后检索的全网检索功能,检索结果会以一种指定的顺序合并起来。

针对校园网用户信息检索的特点。综合考虑信息相关度、时效性和访问量等因素后,系统采用了自定义的排序机制,文档文本相关度作为信息检索的主要排序依据,信息时间和访问次数作为重要的排序因子,系统通过Lucene的激励因子boost值来改变文档得分,从而调整文档的出现顺序。系统为校园网用户提供了通用检索和高级检索功能,通用检索在用户输入检索信息的关键字后可检索出所需信息:高级检索功能为用户提供了更为详细的检索条件,用户可根据需要对信息进行更加精细的检索。系统管理功能除对用户权限进行管理外还对信息检索结果进行屏蔽和进一步处理。

四、网络信息检索的主体技术和相关技术

(一)信息检索服务的主体技术

网络信息检索通常采用搜索引擎技术,该技术是为了解决“信息迷航”问题而提出的。它通过相应的算法在互联网上搜索相关信息,并对信息进行组织和处理,从而为用户提供信息导航。

现阶段,网络搜索引擎有很多,用户比较常用的有Google、有道、百度等等,这些搜索引擎能进行网络信息检索、信息过滤、个性化信息服务定制等比较有特色的服务,但是并没有实现真正意义上的智能化检索。在实际使用过程中,用户想要的不仅仅是有用的信息,他们更希望做信息消费的主人,使信息的搜索可以在一个相对主动的环境中进行。

(二)智能信息索引的相关技术

1.智能技术

智能又可以称之为智能体,它是在用户没有明确具体要求的情况下,根据用户需要,代替用户进行各种复杂的工作,如信息检索、筛选及整理,并能推测用户的意图,自动制定、调整和执行工作计划。智能首先要建立个性化的数据库,在数据库中建立用户基本信息表(包括用户编号、用户名、姓名、年龄、性别等字段)、用户职业信息表(包括职业编号、职业类型、等级、职称等字段)和用户兴趣信息表(包括兴趣编号、兴趣类别、程度等字段),用来详细描述用户的个人情况,其中及时个字段可以设置成关键字。然后建立用户检索策略表(包括策略编号、策略控制、检索词控制、检索时间控制、检索范围控制等字段)和用户检索评价表(包括检索编号、检索时间、检索词、检索结果数量、查全率、查准率等字段),同样的,及时个字段设置成关键字。检索策略表主要是给用户模型的检索定义一个比较完整的检索策略,检索评价表主要是对用户检索的满意度作一个简单的评价描述。

有了用户个性化数据库,一方面,在服务器端吸收智能技术的思想,引入个性化服务的理念,引入用户反馈机制来完善检索机制、提高检索命中率,同时也可提供面向个人的特殊检索服务。另一方面,信息检索用到智能主要集成在客户端,配合用户兴趣完成搜索,它会对用户信息需求、偏好进行区别、归纳、总结,分析用户的兴趣爱好,并借助学习的规则,自动、独立地用户查找用户感兴趣的信息。

2.用户兴趣挖掘技术

实现信息检索服务最重要的就是对用户的喜好和习惯进行分析,日前,通常使用两种方法:其一是通过用户主动提供自己的兴趣来得到用户的个性化向量;其二是在用户没有明确参与的情况下,系统通过观察用户行为来得到用户的兴趣,从而得到用户的个性化向量。使用及时种方法,可以选择下面两种方式:一是用户将自己感兴趣的信息类或在线文档分类后提供给系统,系统从这些文档或信息类中发现用户的兴趣;二是用户提供自己的研究方向和其它阅读爱好等信息,系统从这些信息中发现用户的兴趣。但是,由于用户的兴趣并不是一成不变的,而用户一般不可能提供所有的兴趣以及感兴趣的程度,因此还需要使用及时种方式进行补充。使用第二种方法是根据用户对推送页面的评价信息来更新用户的个性化向量。

随着信息技术的进一步发展,信息检索技术必将更加完善,它将在人类与信息之间建起一座方便的桥梁。我们虽取得一些成绩,但是道路还很漫长,真正实现信息搜索的智能化服务,还有待技术的智能性、主动性、自主性等得到进一步的提高。

网络信息检索论文:网络信息检索的工具

[摘 要] 搜索引擎是人们使用Internet信息资源的重要工具。本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。

[关键词] 信息检索 中文搜索引擎 存在的问题 发展方向

随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具――搜索引擎很好地解决了这一问题。然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。

一、搜索引擎的概念和及类型

搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。

目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。

1.目录式搜索引擎。目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的度较高,导航质量也不错。但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。国内著名的新浪、搜狐、中文雅虎都属于这种类型。

2.机器人搜索引擎。这是一种目前运用较广泛的搜索引擎。国内以百度,google、天网为代表。它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。

机器人搜索引擎具有庞大的全文索引数据库。其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。

3.元搜索引擎。元搜索引擎是一种调用其他搜索引擎的引擎。它是通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。中文元搜索引擎开发较少,较成熟的则更少,万纬搜索是目前有一定影响的中文元搜索引擎。

二、现阶段中文搜索引擎存在的主要问题

1.信息覆盖面有限。现阶段搜索引擎所覆盖的数据库的规模是非常有限的,据美国科学期刊Natures一篇报告中称,全球较大的搜索引擎也只能覆盖现有网页的16%。中文搜索引擎因起步慢、中文信息所占互联网全部信息的比例小(只占全部网络信息的5%)等原因在这方面尤为突出。

2.查全率不高。查全率是指检索出的相关信息量与存储在检索系统中的全部相关信息量的百分比,是判断检索系统质量的度量之一。

国内绝大多数的网站组织的信息大多都是通过浏览方式获得内容。即使是经过精心组织、编排非常合理的网站,也会有70%~80%的网页不能被搜索引擎检索到。中文目录式搜索引擎因需人工介入、维护量大,在这方面表现较明显。

3.查准率较低。查准率更是判断检索系统质量的重要尺度。是指系统所检索到的真正与查询内容相关的文档占检索出的所有文档数的百分比。

造成查准率低的原因是,部分搜索引擎的分类体系与科学知识体系之间缺乏内在联系;类目之间逻辑关系模糊,导致检索路径与搜索引擎类目错位;信息加工深度不够;检索功能单一;检索词的专指性较差;大部分的检索结果是题录式而非全文式,其内容简单等等。机器人搜索引擎的分类和索引缺乏人工的参与,其查准率不如目录式搜索引擎,且检索结果中还含有大量的重复、虚假的信息。

4.专业性的搜索引擎发展迟缓。专业性的搜索引擎是为专门收录某一行业,某一主题的信息而建立,能够提供专题信息查询服务的搜索引擎。目前中文搜索引擎大多是综合性的,能同时收录各行业、各学科的多种信息,但在反映某一行业或某一专题的信息方面很难做到、,不能给用户提供特定的信息服务。这就使得专业人员,特别是某一领域的学者、专家不愿意利用中文搜索引擎去查询资料。

5.检索功能方面存在缺陷。一是检索中符合布尔逻辑运算符的搜索引擎极为有限;二是关键词检索输出的结果相关度排序方式杂乱,不能根据用户需要来选择信息输出的方式;三是多数的搜索引擎是面向主题搜索不是面向用户搜索,不能重复利用用户检索过的成果,更不能对特定的用户进行定题跟踪服务;四是检索网站的主页不规范,有些太简,有些又太繁,而且广告内容太多,无法进行有效检索。

三、中文搜索引擎的发展方向

1.提高查全率。首先是需要开发分布式的系统。这种系统可以把各个接点当作是新的信息资源,扩大数据库的规模,正在兴起的元搜索引擎属于这种系统,它在接受了用户的查询命令后,可同时用多个搜索引擎进行查询;二是把专业数据库资源纳入自己的检索范围。除了Web信息资源外,网上还有大量的非Web信息资源,如联机检索系统、光盘检索系统、专业数据库系统。如中文搜索引擎能把这些Web和非Web资源结合起来使用,即使有的只能查到题录、文摘等内容,也大大扩展了检索范围,能为用户提供较的检索需求。

2.提高查准率。需解决以下几个难关:首先需提高搜索引擎的信息过滤功能。在对网络信息进行集中的搜集之后,搜索引擎还需对这些信息进行鉴别和过滤,即剔除大量的无用信息,而把有效的信息提炼出来并加以聚集;第二则是需对专家过滤后的信息进行一定的检索标引,并给予相关的标识符号,如关键词、分类号、主题词等各种标识,其关键是利用智能检索技术,提高性;把检索的结果存储在相应的数据库中,并由URL与Internet建立链接供用户使用;还需注意信息定期更新,以保障信息的新颖性和链接的性。

3.建立垂直化专业领域的搜索引擎。网络用户所从事的职业千差万别,不同的用户对信息搜索往往有不同的要求。综合性的搜索引擎收录的范围太广、太大无法满足某一特定的需求。垂直化专业搜索引擎则可解决这一难题。它只面向某一特定的领域,专注于自己的特长和核心技术,能保障对该领域的信息的收录齐全与更新迅速。在提供专业信息方面有着大型综合搜索引擎无法比拟的优势,所采用的技术都是些较成熟的技术。

中文垂直化专业搜索引擎的发展已取得了一定的成功,如新浪的新闻搜索,博客搜索、雅虎的个性化旅行路线搜索、百度的MP3搜索、Google的学术搜索,航班搜索等都为用户提供了较好的搜索功能,为今后的继续发展奠定了基础。

4.搜索引擎的智能化发展。智能搜索引擎是未来搜索引擎的发展趋势。可以通过自然语言与用户交互,较大限度地了解用户的需求。智能检索一是表现在搜索引擎技术的智能化,研究重点放在自然语言处理技术和人工智能技术的研究上;另一表现是体现在搜索引擎面向检索者的智能化,它致力于通过分析检索者的检索和浏览行为来学习检索者的需求,利用搜索引擎现有的服务有选择地为检索者提供个性化的服务。

5.加强搜索引擎的检索功能。首先需强化全文检索功能。利用Robot实现对站点页面文字内容的检索技术。比起目录检索,全文检索提供了全新的检索功能,可以直接根据文献资料的内容进行检索,支持多角度、多侧面地综合利用信息资源,、、快速是衡量全文检索系统的关键指标;同时改善用户检索界面,设计简洁、明白的界面引导用户进入检索状态;更方便、实用的检索技巧的利用,中文搜索引擎需简化和统一语法规则,如布尔逻辑检索符号的利用:空格或“*”代替“与”、“+”代替“或”、“-”代替“非”,规范语法符号,节省用户的检索时间;还需研发查询图像、声音、图片和电影的搜索引擎。

6.完善元搜索引擎。元搜索引擎弥补了独立搜索引擎不全的特点,提高了检索的性。现开发出的中文元搜索引擎的数目很少,还有诸多缺陷,需在各方面进一步改进。

元搜索引擎要对各独立的信息特色进行较细致的调查,以确定自己要收录的范围;在对目标搜索引擎的组织中突出独立搜索引擎的检索特色,并设计各搜索引擎之间的检索方式的转换算法,提高用户检索行为的针对性;建立更为灵活的,面向用户的信息检索服务。检索界面要统一和友好,检索方法的设置要提供给用户更多的自由空间,使用户可以按照自己的意愿合理的组织检索式;在检索结果的显示中要开发出一个有效的检索结果去重、选择、排序和优化算法,这是中文搜索引擎开发中的一个重点和难点。

网络信息检索论文:数据挖掘及其在网络信息检索中的类型及应用

摘要:随着当代计算机技术的快速发展,网络已成为人们互相传递信息的一个快速渠道。然而网络信息资源是非常庞大的,这个人们寻找所需要的信息资源带来了很多的不便。网络信息检索经过近几年的快速发展,在解决这一问题上起到了一定的作用,在一定程度上满足了用户检索信息的需要,但在检测的标准率上还是不尽如人意。本文通过对数据挖掘的概念方法出发,探讨了数据挖掘在当代网络信息检索中的应用。分析了数据挖掘与信息过滤和可视化技术的结合,进而提高网络信息的检索效率,弥补现有检索工具的不足。

关键词:网络信息挖掘 数据挖掘 网络信息检索

1、网络信息资源及其特点

所谓网络信息资源就是指网络上能够满足用户信息需求的资源的集合。可想而知,网络信息资源相当的丰富,各方面的都有,其内容涉及到世界上的每一方面,例如:农业、文学、航天、地理、医疗、计算机、法律、娱乐界等几乎所有专业领域,网络资源是知识和信息的集合,是一批非常宝贵的财富。而目前的网络信息资源与传统的不同,以成为一种新型的数字化资源。网络信息资源的特点主要体现在以下几个方面:

(1)信息数量庞大、种类繁多以及传播范围比较广。网络信息类型呈现多样化,主要有文本、数据、图文、图像、音频、视频等信息;其内容也不是单一的既有健康的信息,也少不了有害和虚假的信息,从个人到政府都有一定量的信息。

(2)目前网络信息资源管理机制多样,没有统一的机制,以至于网络信息安全缺乏一定的保障。于是就出现了普遍存在的黑客、计算机病毒和色情信息。国家花费了大量的社会资源来防止有害信息的传播。

(3)由于科学技术的不断发展造成了网络信息资源更新数的极快,在网络信息管理方面就比较困难。网络信息属于自由,因此信息来源广泛,内容呈现出多种多样,质量也就没有了保障。

(4)网络资源较大的优点是它给用户提供了多层次的信息交流模式,反应了当今社会生活的各个方面,形成了网络的百科全书和具有快速的传播功能。

2、网络信息挖掘的类型

2.1 网络信息的内容挖掘

网络信息的内容挖掘就是从网络中存在的内容、数据中发现出对自己有用的信息。网络信息资源类型繁多,其中大量的网络信息资源可以通过在网络中的索引和检索服务直接获取,但是还有一些网络信息是通过一些工具或方法获取,如用户通过提问而动态生成的结果就属于此类信息。还有一些私人网络数据,它们不能够通过就不能通过索引收索出来。另外,网络信息内容是由文本、图像、音频、视频和数据等形式的数据组成的,由此可见网络内容挖掘是一种多媒体数据挖掘形式。

2.2 网络信息结构挖掘

网络结构挖掘是从Web文档结构、WWW的组织结构和链接关系中推导的。网络信息结构挖掘的目的是寻找Web和页面的结构及其蕴含在这些结构中的有用模式,然后对其链接进行合理的分类,通过不同网页的关联有助于用户找到所需信息的相关资源,并且可以通过浏览特定的网页从中获取近期的动态信息。还可以发现Web文档本身固有的结构,此种结构既可以拥有用户的浏览,也可以对网页进行比较。

2.3 网络信息用法挖掘

通过网络信息用法挖掘,可以充分的了解用户的网络数据实际意义。网络信息内容挖掘和网络信息结构挖掘主要是针对原始数据的,而网络信息用法挖掘主要是针对用户和网络交互的过程中产生的数据。这些数据类型包括很多:用户对网络服务器的访问记录、浏览器日志记录、用户的个人信息、用户额交易信息等等。运用网络信息用法挖掘技术能够有效的从服务器以及浏览器端的日志记录中发现隐藏在网络数据中的一些无法通过索引获取的模式信息,还可以了解用户对网络系统的访问模式以及在网络上所进行的行为模式,从而对其作出预测性分析。

3、网络新挖掘在信息检索中的应用

网络信息挖掘的作用除了体现在具有很大的网页的生成上外,还可以通过Web的组织结构和链接关系中发现一些其他类型的知识。网络信息挖掘可以通过挖掘web的结构信息揭示蕴含在web内容之外的许多隐含的有用信息,例如web页面上的U不仅可以反映页面的类型,还可以在一定程度上反映页面间信息的存储位置和不同信息内容的层次关系以及通过分析网页的URL来分析这种层次关系。根据上述原理已有很多人提出了与web页面URL有关的启发式规则,并将其应用于寻找个人主页上。因此,利用网络信息挖掘可以很快的寻找个人主页和与其相似的网页。除此之外,web的信息挖掘还可以对web页进行合理的分类,预测用户的链接使用及链接属性的可视化,对各个企业搜索引擎索引的web页数量进行统计分析等。它也可以揭示文档结构信息中的有用模式,有助于从多个维度和层面提供检索途径。

4、结语

因为信息时代的发展,促使网络信息挖掘成为网络信息处理领域中的一项新技术,它可以使用户通过大量网络信息中,得到数据对象间的内在特性,并根据数据间的关联在网络资源中进行有目的获取相应的信息。目前网络信息挖掘是数据挖掘技术在网络时代网络信息处理中的一项非常重要的应用,同时也是今后网络领域中的一项崭新的研究课题。随着网络的快速发展和不断的普及,网络信息资源不但来源途径更加广泛而且内容也越来越丰富,但如何分析和利用这些无以计数的网络数据是当前比较突出的一个问题。网络信息挖掘在实际工作中具有重要的实践意义和非常广阔的应用前景。

网络信息检索论文:高校图书馆网络信息检索服务研究

关键词:高校图书馆;网络;信息检索;图书馆服务

摘要:文章围绕网络信息检索服务方式、检索方式及用户培训三大环节,针对过于倾向传统信息服务方式、检索方式“边际效应”严重及用户培训质量不容乐观等一系列问题,提出高校图书馆网络信息检索服务的对策建议,以提高高校图书馆网络信息检索服务水平,完善高校图书馆网络信息检索服务体系。

1高校图书馆网络信息检索的特征

随着信息时代的到来及互联网的广泛应用,高校图书馆信息检索也呈现网络化,进而高校图书馆网络信息检索倍受人们关注,成为信息时代影响力较大的信息检索系统,并获得了广大用户的高度认可。最重要的是,高校图书馆网络信息检索秉承以“简单化、智能化、个性化、多样化”为特征的服务理念,来实现高校图书馆网络信息服务建设(见图1)。

1.1简单化———网络信息系统的易用性

对于高校图书馆网络信息检索服务而言,所谓简单化则是指高校图书馆网络信息系统的易用性。高校图书馆网络信息检索具有良好的“人—机”会话界面与帮助支持系统,有关操作程序都在后台进行,用户不需掌握专业的检索原理与技术支持等技能,只需要按照高校图书馆检索指南中的步骤操作即可,无须花费太多的时间即可掌握使用方法。1.2多样化———多角度、多信息载体检索信息资源高校图书馆网络信息检索的多样化特征是网络信息简单化的延伸,在网络信息系统易用性的基础上从多角度、多信息载体中检索用户所需的信息资源[1]。如:利用网络环境与搜索引擎等工具检索自己所需的信息资源;在高校图书馆建设的专门数据库检索系统中,通过检索全文、关键词、题目、专著、作者名称等,检索出所需的信息资源。

1.3智能化———自动分析用户的需求

在信息化时代,高校图书馆网络信息检索智能化是信息检索系统的发展方向。智能化分析比正常分析显得更有智慧,现代高校图书馆网络信息检索系统引用了人类的大脑思维,根据用户所需的要求自动进行识别与分析,并将用户查询请求传递给链接的多个独立型搜索引擎查询处理,其检索过程与知识已经在检索系统中智能运转,用户可直接获得所需的信息资源。

1.4个性化———针对不同用户提供不同特色检索服务

高校图书馆网络信息检索个性化是根据用户需求而展开的特色与个别服务,主要是基于信息用户的信息检索行为、习惯、偏好及其个人特点等多个方面,针对不同用户的个体信息需求提供不同检索服务[2]。如今网络化的普及促使现代信息技术飞速发展,高校图书馆开展信息检索个性化服务更具有优势,网络信息检索不仅与网络信息服务密切联系,还具备一些深受科研人员、学术研究人员喜爱的新特色,因为这类用户群体需要高质量、专业化、针对性与及时主动推送的近期信息服务。

2高校图书馆的网络信息检索服务体系

高校图书馆网络信息检索服务分为服务方式、检索方式及用户培训方式三类内容,各类方式又具备自身的各项功能(见图2)。64第36卷第9期河南图书馆学刊2016年9月。

2.1服务方式

2.1.1传统信息服务方式。传统信息服务方式是信息需求者向信息提供者索取信息的一种信息服务方式,是通过“拉取”方式而实现的。但随着信息网络化时代的到来,其未能更好地满足用户需求,获取信息时间长、费用高、信息传输效率低、服务器被动服务及信息资源浪费等一系列问题成为其应用于实际的瓶颈。2.1.2主动信息服务方式。主动信息服务方式是信息提供者主动向信息需求者提供信息的一种信息服务方式,在不需要用户指示与干预的情况下,可根据用户的需求与偏好,自动按照用户的需求为其提供相应的信息资源。其思想核心实现了信息服务系统的“被动响应”向“主动响应”的转变,是新时代高校图书馆网络信息服务的发展方向。

2.2检索方式

2.2.1分类语言检索方式。分类检索是指从学科和专业角度根据系统信息资源有序化的分类体系进行信息输出的族性检索方式,包含分类导航、期刊导航及分类检索等三大内容。分类导航与期刊导航是指利用网络信息检索系统,通过明细分类科目的所属关系的方式,逐层浏览并检索出所需信息资源的一种检索服务方式。分类检索是选定不同层级的类目,利用主体语言检索方式对检索活动进行学科范围针对性限定的检索方式。分类导航、期刊导航及分类检索三者都为分类语言检索方式,在相辅相成的同时也存在一定的差异性,如:分类导航直接检索为“论文”;期刊导航初次检索为“期刊”,二次检索是“论文”;而分类检索则是在检索前就设定学科专业的范围,突出分类语言的检索方式。2.2.2主题语言检索方式。主题语言检索方式分为初级检索与高级检索。初级检索的实现形式又包括快速检索与基本检索。快速检索是讲究速度,只需要输入关键词即可查询到信息结果的简单的检索方式。基本检索关系到多个方面,是对年度、作者、学科、专业、机构等多项途径进行限定的一种检索方式。无论是快速检索还是基本检索都采用单检索词进行。此外,高级检索相对初级检索要复杂些,不仅需要对检索结构进行形式限定,还需要通过多检索词对其内容进行限定,综合运用布尔逻辑、位置逻辑、截词技术和限定技术对多个检索词进行逻辑组合,构造出能够表达信息检索诉求的检索策略,以提高检索结果的度。

2.3用户培训方式

2.3.1教学科研类培训方式。该种用户培训方式主要以教学科研为主,面向的主体对象为学校的教学科研人员及在校研究生。在高等院校,这类人员的知识层次较高,信息意识也较强,可采用“网络信息检索”培训班与计算机信息检索课的方式对其进行信息检索原理、信息资源特征、信息检索技巧等培训,从而提高教学科研类用户群体的综合信息检索素养,并使其掌握检索技能。此外,也可采用理论与实操相结合的讲解方式同步进行,以取得良好的培训效果。2.3.2技术人员与大学生类培训方式。这种用户培训方式的培训主体对象为在校技术人员与大学生群体,因为这类用户群体比较讲究学以致用,可采用“网络信息检索”培训班与文献检索课程的培训方式进行培训,主要是介绍计算机检索的原理及通过上机实习来运用检索语言表达信息需求,以提高检索效率,提高用户群体信息检索的能力。

3高校图书馆的网络信息检索服务问题及对策

3.1创新“传统+主动”双向结合新模式高校图书馆习惯倾向于传统信息服务方式,但随着信息网络化时代的到来,获取信息时间长、费用高、信息传输效率低、服务器被动服务及信息资源浪费等问题,影响着高校图书馆的信息检索服务建设。为了弥补传统信息服务方式的弊端,高校图书馆可创新“传统+主动”双向结合新模式,在原有的传统信息服务基础上,充分利用现代智能推拉、用户及信息过滤技术一体化等信息技术,完善计算机用户检索服务系统。主动推送服务系统具备主动信息、预测需求、采取信息、处理信息、挖掘知识、人机交互及主动使用用户等特征。该系统能够根据用户的需求、偏好或者事先的约定事件,不需人的指示而自动进行网络信息检索服务工作,可主动将用户所需的信息安全地传送给用户,以提高高校图书馆网络信息检索服务效率[3]。

3.2紧抓检索方式“质”的建设

每一个网络信息检索系统都通过多种形式提供初级检索、高级检索和分类检索,高校图书馆也不例外。初级检索、高级检索及分类检索的检索顺序呈“边际效应”递减现象,初级检索使用率较高,最易被用户接受;高级检索一般能为高级用户所使用;分类检索使用率很低[4]。由此可见,高校图书馆要紧抓检索方式“质”的建设,减少检索方式的重复建设、盲目充数以及由此造成的用户负担加重。74王艳军:高校图书馆的网络信息检索服务实践研究3.3“以点带面,以面带片”的训练与引导近年来用户培训质量不容乐观,不少高校的信息检索培训教师尚未能实际掌握构造检索策略的各种方法与技巧,要他们来传授实用的检索技能,显然是力不从心的,只有经验丰富、训练有素的专职检索人员才有可能胜任信息检索培训工作[5]。所以,高校对于出任专职检索人员的员工应当予以重视,迅速提高培训质量。因此,可由省级图书馆学会、信息学会及高校图工委组织与引导具备丰富网络信息检索经验的专家,对有一定实践经验的专职信息检索人员进行强化训练,再向教学科研类人员、在校技术人员与大学生等用户培训群体传授检索知识与技能,秉承“以点带面、以面带片”的方式,提高高校图书馆用户群体获取和利用网络信息资源的能力。

4结语

现代高校图书馆网络信息检索服务,要秉承以“简单化、智能化、个性化、多样化”为特征的服务理念,来实现高校图书馆网络信息服务建设。其中“简单化”旨在提高网络信息系统的易用性;“智能化”旨在自动分析用户的需求;“个性化”旨在针对不同用户提供不同特色检索服务;“多样化”旨在多角度、多信息载体检索信息资源。要想丰富高校图书馆网络信息检索服务体系,应当不断改进与完善过于倾向传统信息服务方式、检索方式“边际效应”严重及用户培训质量不容乐观等一系列问题,创新“传统+主动”双向结合新模式,紧抓检索方式“质”的建设,“以点带面,以面带片”地对用户进行训练与引导,从而提高图书馆管理水平,满足现代读者的真正需求。

网络信息检索论文:图书馆网络信息检索服务实践探索

【摘要】当前随着科学技术和互联网的发展,信息网络技术在生活和教育中的适用范围越来越广泛。在高校图书馆中的使用也越来越频繁,尤其是在信息检索服务方面的使用,不仅满足了信息检索服务效率,而且提高了用户的使用感受。本文在分析了当前高校信息服务的特征后提出了一些发展建议,希望能够为高校图书馆信息检索服务实践提供一些理论支持。

【关键词】高校图书馆;网络信息;检索服务

21世纪是网络化和信息化的时代,各行各业的发展数据在网络中汇集和传播,在这一背景下就需要强大的信息检索服务来支撑数据工作。高校图书馆随着网络信息化的快速发展成为新时期信息汇聚的一个重要地点,因此高校图书馆信息检索服务成为图书馆发展和实践的主要方向之一。高校图书馆由于自身特点,汇集的是各学科研究研究成果和经典书目,因此,高校图书馆网络信息检索服务成为师生的关注点。

一、高校图书馆网络信息检索特征

高校图书馆作为高校师生主要的信息来源之一成为师生教学科研和学习的重要途径,图书馆网络信息检索服务随着网络化和技术的发展不断获得师生的认可和喜爱,并且在发展中逐渐朝着简单化、智能化、个性化的方向发展。(一)高校图书馆网络信息检索服务日益简单化。由于高校图书馆是信息和资料汇聚的地方,因此师生对于信息检索服务要求很高。当前高校图书馆网络信息检索服务整体呈现出了简易化的发展趋势,并且在信息检索系统方面不断地提高和升级,力求做到操作简单和快捷,保障师生能够在庞大的信息面前快速地寻找到自己想要的资源和信息。高校图书馆网络信息检索系统在人与机器对话方面呈现出良好的沟通和交流,可以保障对话界面顺畅,在信息检索操作系统中,通过完善专业的检索原理和技术,实现了优良的后台操作,只要师生在检索过程中能够按照系统提示的步骤进行操作就能够在短时间内寻找到自己需要的信息。(二)高校图书馆网络信息检索服务日益多样化。高校图书馆网络信息检索服务在当前网络不断发展的情况下日益呈现出多样化的特征,主要表现为在网络信息检索的过程中多角度和多载体检索师生所需要的信息和资源。在高校图书馆信息检索服务中师生可以通过不同的关键词、题目以及自身需求检索国内或者国外的相关资源和信息。不仅如此,高校在网络日益发展的情况下不断完善自身网络信息数据库,以方便高校师生进行日常的信息检索。另外,国内各高校间的资源互享已经成为高校网络信息检索服务的重要途径,来满足高校师生对于信息的需求。(三)高校图书馆网络信息检索服务日益智能化。当前,高校图书馆网络信息检索服务已经在朝着智能化的方向发展。通常对于智能化的理解是在正常检索的基础上通过检索使用到的关键词和题目进行智能分析然后在资源库中进行搜索。当前图书馆网络信息技术在模拟和借鉴了人类大脑运行规律的基础上根据用户的实际需求进行自我分析和鉴别,并通过网络信息检索系统进行检索并反馈给用户。这样用户在检索的过程中能够有选择地进行甄别和检索,寻找到更加合适的资源和信息。(四)高校图书馆网络信息检索服务日益个性化。当前高校图书馆网络信息检索服务另一个特点就是具有个性化。这一特征是在智能化的基础上进行延伸的。高校图书馆网络信息检索通过智能化的对比和分析,在确实用户需求的基础上提供个性化的服务,这是以用户日常检索的习惯和行为方式为依据的,并通过不同的检索内容提供不同的服务。由于高校图书馆网络信息检索体系主要对面的用户群是高校师生,因此,在此基础上要根据科研人员和师生的实际需求为依据进行系统开发和完善,不断地提高系统的性能和服务水平。

二、高校图书馆的网络信息检索服务问题及对策

(一)重视信息服务的广度和深度。在高校图书馆网络信息检索服务中,首先要注重信息服务的深度和广度,这是有高校自身特点所决定的。一方面,图书馆网络信息检索服务的广度要覆盖到高校师生所需要的范围,包括学校开设学科、近期的科学研究、不同类型信息资源、不同年限的信息资源不同程度和适用范围的资源。另一方面,图书馆网络信息检索服务的深度要涉及各个领域资源和信息的详细程度。而且能够通过不同的分类进行检索,这样能够为师生在检索资源时节省时间,更好地进行科研和学习。(二)加强检索服务的宣传。当前随着高等教育和社会的发展,高校学生呈现出逐年增长的趋势,高校图书馆的用户越来越多。因此,高校图书馆网络信息检索服务要在新生入学之时就做好培训工作,以此来提高用户的检索能力。这就要求高校图书馆负责检索教学的教师能够首先熟练本校的检索系统,提高自身的业务水平,并不断地进行学习。其次,要通过教师的讲解和示范,为学生建立良好的网络信息检索思想,重视网络信息技术的学习和应用。(三)提高网络信息检索服务质量。当前网络信息成为一个大的网络,其中包含着多种多样的搜索引擎,并且提供着不同程度和类型的搜索。在高校图书馆网络信息检索中主要包含这初级检索、高级检索和分类检索这几种主要的检索模式。但是,在高校图书馆中由于学生学习程度有限往往采用最多的是初级检索。因此,在高校网络信息检索服务中要根据用户的检索质量和层次来提高自身检索质量建设,减少不必要的检索方式建设,避免给检索系统造成不必要的负担。

三、总结

当前随着社会和科技的发展,高校网络信息检索服务也在不断地建设和发展。在发展过程中,高校网络信息检索服务要以用户实际需求为基础来提高自身建设和服务能力,不断丰富自身数据库和信息网络,为高校师生的教学科研工作和学习提供良好的保障。

网络信息检索论文:浅谈网络环境下信息检索课教学内容的改革

论文关键词:网络环境 信息检索课 教学内容 信息素质教育 信息意识 信息能力 信息道德

论文摘要:环境的变化一直是推动信息素质教育前进的动力。作为我国信息素质教育的重要基地的信息检索课,在网络环境下,其教学内容要改变传统的只侧重文献检索和中外工具书的利用,而是向信息素质教育转变,紧扣信息意识、信息能力和信息道德三个方面来设置,真正成为学生在资源获取与知识融入的过程中,培养创新性思维的一个重要环节。

信息素质(Information literacy)概念的提出,可以溯源到1974年美国信息产业协会主席给美国图书馆与信息科学委员会的报告。而被人们接受程度较高的当属美国图书馆学会ALA(American Library Association)在1989年报告中给出的定义:能够判断什么时候需要信息,并懂得如何去获取信息,如何去评价和有效利用所需要的信息。

信息素质是大学生必备的素质之一,在高等院校开设专门培养学生“信息素质”的课程,不仅是当前我国开展素质教育的要求,也为学生的终身学习奠定了基础。有专家认为,我国信息素质教育始于文献信息检索。它是不可多得的中国高校开展信息素质教育的一个重要基地。从20世纪80年代以来,从一般的用户导读、讲座和培训,直至正规课程的普遍开展。从全校讲座到相关的研究生课程,逐步扩大,由浅入深,在信息素质教育方面已经做了许多扎实的工作。环境的变化一直在推动我国的信息素质教育的前进。

1 信息检索教学在高校人才培养中的必要性

美国实用主义教育家杜威曾说过“学校中求知识的目的,不在于知识本身,而在于使学生自己获得知识的方法”。1999年《中共中央、国务院关于深化教育改革推进素质教育的决定》对高等教育实施素质教育也提出了明确要求,“高等教育要重视培养大学生的创新能力、实践能力和创业精神,普遍提高大学生的人文素养和科学素质”。教育部2001年工作要点中提出坚持用近期的科学文化成果教育学生,融传授知识、培养能力和提高素质为一体,促使学生广泛参与科研和社会实践,加大对学生创新精神与实践能力的培养力度。高等学校人才培养的关键就是创新、求索、综合能力的培养。

信息检索课是信息素质教育的重要课程,是培养学生具有良好的信息意识,掌握文献检索方法,主动摄取知识、更新知识,培养学生自学和独立科研能力的重要环节。随着信息素质教育在高校的深入开展,在信息检索课教学中,开始注意突出信息素养能力的培养,即将检索科学与科研信息调研结合。如康奈尔大学图书馆在门户网站上建立调研策略(research strategy)而不是一般的检索策略(retrieval strategy)的教学网页,从如何选题、如何寻找背景资料到科研论文、综述文献资源的获取、鉴别和引用,体现出信息研究与分析的真正内涵。又如克罗拉多大学Tutty图书馆制作了科研专题信息调研分析范例网页,内容包括如何系统查找课题相关资源,评价选择书目及二次文献资源、发现馆藏、确定学科重要人物、理论影响性评价、引文分析、跟踪近期信息等等,并将这些内容与专业课题结合,帮助学生将获取的知识信息融入自身专业课题基础中,从而使学生在初步接触课题的同时,通过信息知识的获取启发科研思路,建立科学假设。

信息检索课程作为以培养本科学生的信息能力为目标的信息教育的重要课程,应把信息意识、信息道德诸方面的教育贯穿于信息能力培养的具体过程中。传统的文献检索课程是基于图书馆素质教育的作用而开设的。其内容侧重于文献检索和中外工具书的利用。1992年2月原国家教委高教司[1992]44号文件对文检课教学内容作了规定:文检课教学应使学生学会使用检索工具与参考工具书的使用方法,初步掌握计算机检索方法。还规定文检课教学要分三段进行:在新生入学时期进行图书馆利用方法的教育,在三、四年级讲授文献检索与利用的知识,对研究生要增加文献资料整理利用的知识,包括文献的鉴别、选择、整理以及情报研究方法等。这说明了文献检索教学不仅是信息获取知识和方法的传授,而且是通过对学生进行信息获取、分析、处理和运用能力的训练,培养学生的创新意识。

信息检索课程已经不仅仅是图书馆一般利用数据库检索技术等信息获取的教学,而成为学生在资源获取与知识融入的过程中,培养创新性思维的一个重要环节。

2 网络环境下信息检索教学内容的改革

2002年1月在黑龙江大学召开了信息素质教育学术研讨会,会议前身是“文献检索与利用”学术研讨会。会议认为,在网络环境下,原有的文献检索课内容偏窄,缺乏创意和科技含量,必须加以改革,而改革的方向就是向信息素质教育转变。新环境下信息检索课教学的目标是强化学生的信息意识,增强信息道德观念,提高学生的信息获取、利用能力、自学能力以及知识更新能力,提高大学生的综合素质。因此,信息检索课的教学任务势必要随着信息社会的发展而不断的改革和扩充。信息检索课程要为学生今后的学科发展选择教学内容,而不是为考试而选择教学内容。我国的一些高校为了适合不同专业的特点安排教学内容,较好地达到教学目的,针对不同专业编制了不同的教学大纲。文献检索学作为国家标准认可的具有相对独立地位的分支学科,虽然在新形势下需要补充更新的知识内容较多,但仍具有其知识体系特点,各不同专业的本科学生的信息检索课程仍包括通用的教学内容。美国的信息素质教育是通识教育,德克萨斯州立大学的信息素质教育课程(TILT)包括概论、选择、检索、评价和本馆引论五部分,重点讲授信息基础和信息利用的技术和方法。而对于具体检索工具和检索系统的使用方法,则只讲比较典型的一个检索系统的详细使用。因为我国的信息素质教育主要是从大学才开始的,学生多数没有信息资源检索的感性认识,因此,不同专业的大学生在教学内容基本相同的前提下,在细节上考虑到学生专业性的特点,应该是必要的。

《信息检索》课的教学内容应该紧扣信息意识、信息能力和信息道德三个方面来设置。具体来讲包括如下方面:

2.1 信息意识部分

传统的文检课着眼于培养学生文献信息检索工具的使用方法,即信息技能,而不是他们的信息素养。进入网络化信息环境后,教学内容应有所改变,引导学生掌握如何从各种途径获取所需信息。

为了培养学生的信息意识,在教学内容中除了信息、知识、情报等概念,信息资源的分类、特点、识别,专业文献的特点等外,还可增加大学生的信息需求、网络上免费学术资源分布情况等内容。据统计,大学生最感兴趣的内容是中文期刊、教育信息源和新闻信息源。大学生有着快速接收新鲜事物的能力,但却经常会为找不到有用的信息而苦恼,而上述三种类型的资源,正好为学生提供了品质的信息源。各类网络信息源、电子图书、外文期刊等是学生较为感兴趣的内容。统计结果还显示,学生对传统印刷型的资源基本提不起什么兴趣。所以授课内容中应包括网络教育信息源(四六级、考研等)、学科相关的专业信息源、网上参考工具书、的网络资源导航等的特点及使用方法等内容。通过这些知识的学习,使大学生对信息的概念、特点、规律有了基本的了解,对信息在社会中的地位、作用有较深刻的认识。从而确立他们较强的信息价值观念和培养从信息角度观察问题、解决问题的思维习惯,并且掌握一定的科学思维方法和研究方法。为了加深印象,可在课后布置一个小作业,激发学生去挖掘信息源,了解周围的信息环境。

2.2 信息能力部分

这一部分教学的目标是使学生能够熟练运用各种信息源,高效地获取、处理、分析和利用所需信息。具体的讲,信息能力应该包括提出和分析信息需求的能力、寻找信息源的能力、评价信息源的能力、信息利用能力等。在教学当中我们主要讲授信息检索原理、方法、基本途径和步骤、检索策略和技巧,检索工具的结构,计算机信息检索基础等,主要数据库的检索使用,特种文献的检索,搜索引擎的检索,以及对检索到的信息进行鉴别遴选、分析归纳、概括表达,在自己的科研课题或其它任务中寻求信息支持。

重点讲解按出版形式文献的检索途径、检索步骤、计算机检索的逻辑算符、位置算符、截词符、字段限制及综合运用;讲课侧重典型的检索工具或数据库,如本校图书馆引进的数据库及网上免费学术型数据库的检索,重点讲清检索思路,增加信息分析和利用方法的介绍、检索策略的制定和调整等。讲解利用网上搜索引擎查阅资料,重点解剖一种搜索引擎即可,使学生举一反三,掌握各种搜索引擎的使用方法;讲解如何选取主题词、检索策略的制定和调整、提高查全率和查准率的方法、原文文献的索取等。增加文献类型尤其是外文信息识别的内容。实践证明,在教学中引导学生充分利用专业数据库和网络资源,是提高学生信息能力的最直接和最有效的途径。

2.3 信息道德部分

信息道德是指整个信息活动中的道德,是整个信息活动信息加工者、传递者、使用者相互之间各种行为规范的总和。随着互联网的发展,不仅增强了用户利用信息资源的自主性,而且使得与信息知识合理利用密切相关的知识产权保护问题日益复杂化,所以我们在教学中不能忽视信息道德教育。在对信息道德和信息法规内容的认识上,有相当多的学生仅认为“计算机犯罪”属违法问题,只有少数学生了解“对知识产权的侵犯”、“对个人隐私权的侵犯”和“网络上的人为恶习”等也属于违法或不道德范畴。

信息检索课在教学过程中,一般都安排了特种文献检索的内容,使学生充分了解专利、标准的基础知识和检索方法。除此之外,应当尽快地将《著作权法》对相关信息活动的规范、对数据库使用权限的相关规定等内容进行普及。教师要教育学生不仅要学会提取信息,还要学会用正确的观点去分析信息,辨别是非,去伪存真,分清精华与糟粕,才能更好地利用网络信息。学校也要进一步加强和规范因特网教育信息及网站的管理,可以在教育网站的入口处设置相应的服务器或防火墙,对网络信息进行净化处理,消减不良信息的负面影响。

2.4 实践部分

信息检索课的目的是培养学生实际解决问题的能力,实习题的作用在于巩固课堂教学内容,是理论知识融入实践训练中,从而达到循序渐进、提高能力的目的。实习题的设计,一要结合实际,二要突出新意。既要能够有效检验课堂知识的运用能力,又要与社会实际或科技前沿课题相结合,使学生认识到所学知识的实用性和应用上的显著效果。实习题要由浅入深,可以针对一个问题多角度发问,如:你所学专业的热点问题都有哪些?从事相关研究的学者都有谁?他们的著作都有什么?他们参加过哪些学术会议?有发明吗?等等,以此类推,还可以有很多设问。

实际操作中实习题分为两大类型。一类为阶段实习题。按课程教学需要,一般讲完一段较为独立的内容就布置一批相关实习题。另一类为专题文献检索题。这部分实习为综合实习题,围绕科研课题研究活动的实际情景设计适合本科生的课程任务,从分析课题、检索所需信息、评估结果、编写检索和分析报告综合练习。要求学生综合运用检索理论和检索技能,通过各种渠道搜集相关信息源,经过整理归纳,完成实习报告。以往课程比较重视的是学科资源的获取,学术性强而目的性弱,用的多是经典的检索工具、联机数据库,课题往往是虚设的多,学生并不太介意检索的结果。但是对于阶段实习题,我们可以结合社会生活出一些问题,比如要去某地旅行,出发前需要了解该地的地理、风俗、文化、名胜、路线、交通、费用等各方面的信息。我们可以设计出更好的题目来。

我们在教学的过程中,可以选择和专业学科紧密结合的学生毕业论文或毕业设计作为贯穿信息检索课程全过程始终的教学主线。从毕业论文信息对不同文献类型的需求,毕业论文题目的选择拟订、题目的分析、检索词和分类号的拟订、检索词的规范、检索式的拟订,不同学科数据库的选择,检索过程检索策略的修订、检索结果的分析与汇总等,学用结合使学生对信息检索课程的理论和实践有了系统的的掌握。

3 内容设置上应该注意的几个问题

3.1 虽然手工检索在诸多方面似乎变得越来越“不合乎适宜”,但其中一些基本原理、基本方法却是非常“经典”的。手工检索与计算机检索内容的安排不应偏废,传统文献目前仍在大量使用,通过其传播的信息量也相当大,而电子化、数字化、计算机网络化传播的信息正在不断扩大。因此,内容上要两者兼顾,适当减弱传统信息载体、检索工具的讲述,注重现代技术信息传播、检索的内容。

3.2 教学内容的设置要根据教学对象的不同,侧重点有所区别。如对于大一、大二学生来讲,帮助他们了解各种信息资源,根据需要选择合适的信息源。电子资源教学方面侧重于介绍图书馆的数据库,主要是中文全文数据库的检索,以及图书馆书目系统的查询。而对大三、大四学生开课,侧重于检索技能的培养:选择合适的数据库;使用恰当的检索词及检索策略;在网上搜索的能力。电子资源方面则要增加外文数据资源的检索,学科门户、学科资源目录导航。在搜索技巧方面,对低年级的学生主要讲解确定所需要的信息的关键词(要尽可能地列举出更多的关键词或短语),如果是英文,千万别忘了单词的不同拼写、简称、缩写等情况,同时应该区分哪些词扩展了原来的含义(上位词),哪些词缩小了原来的含义(下位词)和适当的检索步骤。而对高年级的学生除了掌握这些以外,还要学会评估搜索策略、搜索结果的数量、质量和相关性。

3.3 及时更新和扩充新的教学内容,使大学生及时了解和掌握新型信息资源、信息检索技术及相关领域的新变化、新成果,通过介绍网上免费资源,推荐开放获取文献,普及科技查新检索知识等,以便与时俱进、充分利用;另外还要增加实用的信息检索利用的内容,追求教学效果。结合学校的重点学科、专业,与专业有关的国内外著名检索工具、全球著名的搜索引擎、相关的检索目录、网址、学科导航系统以及获取专业文献全文,四、六级考试、考研升学以及就业招聘等内容都应作为教学内容。

3.4 高校信息检索教学的目的是为了使学习和科研者在学习科研活动中,能够在尽可能少的时间内查找到尽可能多的学术信息。所以一般来说检索课教学应主要解决学术信息资源的获取问题,其它资源信息如生活类信息的检索等应该放在次要的地位。就现阶段而言,学术信息资源应该是选择性的信息资源,即综合或专业性数据库(尽管互联网上也存在着大量的免费学术资源,但这种学术资源往往是零散的,不充分的)。也就是说,教学工作的重点应该解决学校花大价钱所购买的电子信息资源的使用。

4 今后的发展方向

图书馆是高校信息素质教育的基地,拥有丰富的信息资源和大批图书馆学的专家,但缺乏各个学科的专业人才,无法真正把信息素质教育渗透到专业学习中。在这方面,我们可以借鉴美国的成功经验,首先认识我国高校的学生应当具有什么样的信息素质能力,如何来实现这样的目标,根据我国的国情和历史及现状制定信息素质教育指标体系。此外,还要积极开展图书馆员与院系教师的合作,针对具体学科展开信息素质教育,目前,在线信息素质教育已经成为美国大学开展用户教育的主要形式。融入课程建设、个性化网上自导教学、建成用户的信息门户网站等方式都已经被广泛应用在教学实践中。这给今后我国信息检索课教学工作带来一些启示:

4.1 配合专业课教学为学生创造信息需求背景,以实际需求作背景进行教学,使学生了解本专业相关领域的信息源及信息索取途径。重点剖析典型的专业检索工具、参考工具书及专业数据库的检索和利用,让学生带着问题和需求来学习。

4.2 组织学生进行小组“合作探究”,充分发动学生自主学习,教师做一些引导性的工作。提出与已学过的学科内容有关的问题,检索大量的信息源,使用环境、人力、工具等资源进行学习。鼓励相互间的交流与合作,自行总结归纳知识点,检索结果没有好只有更好。这样的教学方法能够充分调动学生学习的积极性、主动性,对于培养学生的创新精神与实践能力都有积极的作用。

4.3 加强与各专业课教师的联系,注意搜集各个专业的科研课题和学生毕业论文的题目按不同学科专业分类,作为信息检索教学的实例和学生实践课的作业。任课教师做信息参考咨询工作和学科导航库的建设工作,应多收集信息检索方面的事例。

参考文献:

[1] 杨淑琴.网络信息时代高校文献信息检索课教学改革之探讨[J].科技信息,2007,(33).

[2] 颜瑜,杨海鸥.文献检索课在网络时代的变革[J].图书馆理论与实践,2005,(2).

[3] 陈洁清.专业课教学与大学信息素质的培养[J].中国科技信息,2007,(15).

[4] 余晓蔚.文献检索课教学新思路[J].高校图书馆工作,2007,(6).

[5] 王泽琪,周凤飞.体现本科专业特点的信息检索课程教学内容研究[J].图书馆工作与研究, 2007,(3).

[6] 刘君君,周进良.大学生研究性学习中的信息素质与信息资源保障[J].现代情报,2007,(1).

[7] 李武.美国和香港地区开展在线素质教育的情况分析与启示[J].四川图书馆学报,2004,(1).