现代信息检索服务系统有哪些类型?各自的特点是什么?举例说明

2020-04-24 科技 387阅读
现代信息检索服务系统指计算机信息检索系统,主要包括,联机检索系统、光盘检索系统和网络信息检索系统。
(一)光盘数据库检索
光盘数据库检索是由微机、光盘数据库、检索软件等组成,目前国内普遍采用的是网络检索系统,它是由光盘服务器、计算机局域网、光盘库/磁盘阵列、检索软件等组成,其特点是设备简单、费用低、检索技术易掌握,但检索范围受到光盘数据库的限制。更新不够及时;相对于手工检索而言,它的检索速度快,检索灵活方便,检索入口多。
(二)联机检索
联机检索系统是由联机服务的中心计算机,检索终端。通讯网络、联机数据库、检索软件等构成,检索终端通过信息路线与信息系统的主机连接,在中央处理机的控制之下查询系统的若干个数据库,并能够与系统实时对话,随时调整检索策略。其特点是检索范围广泛、检索速度快,检索功能完善,及时性好,可以联机订购原文,它拥有的数据库量大,更新及时,但检索技术复杂,设备要求高,费用昂贵。
(三)网络信息检索
网络信息检索系统是由计算机服务器,用户终端、通讯网络、网络数据库等组成,其特点是检索方法简单、检索灵活方便、及时性好,检索费用和速度低于联机检索系统。通过网络接口软件,用户可以在任何一个终端查询各地网络上的信息资源。网络检索实际上是更加广泛的联机信息检索系统。
1.DIALOG系统概述
美国Dialog系统是目前世界上规模最大、影响最广泛的综合性商业联机检索系统,也是我国科技界广泛使用的系统。其中心设在美国加利福尼亚州的PALOALTO市。
Dialog联机检索用户遍布世界100多个国家。D1ALoG现有全文、题录、事实及数据型数据库数百个,都是质量很高、很权威的核心数据库,其中包括著名的工程索引(Ei)、科学引文索引(SCI)、英国科学文摘(1NSPEC)、世界专利索引(WPI)等,其数量平均每年约增长20%一28%。文献量已近数亿篇,内容涉及自然科学、社会科学、工程技术、人文科学、时事报道及商业经济等各个领域。
DIAIOG提供的服务项目有各种类型信息检索、定题股务、原文订购(E—mail,FAX或邮寄传递)等。它的检索功能强大,深度和广度要求高的检索均可做到,数据库更新及时,数据库中收录的文献年限长。利用Dialog系统,可进行项目交新、文献调研、课题立项、申报专利、了解市场动态和竞争对手、新产品开发、公司的背景憾况、经济预测等信息。
(1)联机准备。对于用户而言,要想使用Dialog联机检索系统,首先要具备相应的软、硬件设备;其次,要向Dialog系统申请联号,交纳一定的开户费用,每年要文年费和数据库使用费。
与DIALOG联机所需要的软、硬件设备包括终端、通信软件和调制解调器。通信软件安装在用户终端,用于实现用户和主机间的通信,Dialog LINK是dialog系统专门为用户设计的通信软件。该软件功能丰富,集成化程度高,具有自动登录或按号功能及在联机前建立并存储检索式,存储、显示和打印检索结果,显示图形,标记、存储记录,追踪记忆等功能。该软件是动态更新的。
在申请成为Dialog用户后,系统将为用户提供两个号码:
1)用户号。用户号(User Name)是D1ALog用户的账号,也是用户的标记。系统将对此用户使用系统的情况进行跟踪、记殿、邮寄账单和数据库更新资料。当用户与DIALOG系统进行各种联系时,均须提供账号。
2)用户口令。用户口令(Password)是用户进入D1ALog系统的钥匙,当用户进行联机登录时,用户名和口令必须结合起来使用。
(2)联机方式。在用户具备了上述条件并安装好各种硬件及软件后,就可以实现与Dialog检索系统联机。Dialog系统向用户提供多种服务方式、检索界面及各种数据库。DIALOG的联机方式有两种:
1)通过CHINAPAC(专线)与D1ALOG联机。具体过程为:①输入主机所属的分组交换网址;②输入系统标识符;②输入用户号;④输入用户密码。
2)通过CHINANET或Internet与Dialog联机。如果用户的计算机已经与Internet联网,则可使用远程登录命令Telnet diaLoG.com或通信软件Dialog LINK,就可以登录到DIALOG联机系统,以文本界面方式检索Dialog数据库,也可以使用ie浏览器以Web的方式检索Dialog数据库。与专线方法相比,这种联机方法更加直接、方便。DIALOG系统的Internet Web界面的检索方法有以下几种:
a.利用Web直接上网检索,其web网址为http://www.DialogWeb.com。这种方式检索赞用较低,缺点是如果用户需要将所有检索过程存盘,就要一屏一屏地存盘,否则随着检索指令的变化,不及时存盘,数据容易丢失。
b.特别为专业人员推出的web界面。其网址为http://www.dialogclassic.com。这是最新推出的界面,速度快,检索过程每一屏幕均保留,不丢失效据,便于存盘,界面是专业人员熟悉的界面,能很快地从旧检索方式转入适应新的web界面。
c.非专业检索人员web界面。其网址为http://www.dialogselect.com。dialog select作为在Internet上的傻瓜界面主要针对最终用户,而非专业人员。对于初学者、最终信息用户和不愿学习Dialog检索指令的人可使用其傻瓜界面。 ‘
d.数据库蓝页网址:http://library.Dialog.com/bluesheets。用户可以按数据库名称、文档号、主题浏览蓝页。数据库蓝页提供每一种数据库的收录范围,可供检索的字段、打印格式、记录样式及收费状况等。
(3)Dialog系统的检索特点。
1)Dialog系统具有两种检索方式:菜单式和命令式。菜单式指Dialogweb (guided search)及DialogSelect的检索方式,其检索界面为图形界面,明确直观。该界面无须了解Dialog检索指令,适合于非专业检索人员和初学者使用,用户可以按照系统提示一步一步进行检索;命令式指远程登录(Telnet)、DialogClassic及DialogWeb(command search)的检索方式,检索时需输入各种指令,检索快速、准确,适合于专业人员使用。
2)DIALOG系统有两种索引:基本索引和辅助索引。从上述可知,联机检索是通过倒排档进行的,Dialog系统的田搽档就是基本索引和辅助索引。
基本索引字段主要有标题、规范词、自由词、文摘等(各个数据库的基本检索字段不完全相同,用户需要查问相关数据库的主页才能确定)。绝大多数数据库都包含TA、DE、ID、AB(标题、叙词、自由词、文摘)4个基本索引字段。基本索引字段采用后级代码进行检索。如SMOTOROLA/CO将检索字段限于公司名称字段;SANTHRAX/TI将检索词限于标题字段。
Dialog系统数据库将作者、单位名称、期刊名称、文献类型、语种、出版年份等作为辅助索引字段,采用前缀代码检索。如SAU=JOHNSON,S?;S PY=1998等。适当使用这些检索途径,用户可以迅速、准确地找到自己所需要的信息。
3)DIALOG系统的多数据库访问和查重功能。DIAOG可用一次性检索方法对多个数据库进行检索。用一次性检索方法不仅可以比较交叉文档的检索结果,而且可以限制检索项、组配检索项和显示检索结果,使多文档查找犹如在单一文档中查找一样灵活,该功能一次最多可以检索60个数据库。由于一次性检索的命中文献为所选数据库检索文献之和,其中有些文献为重复文献,dialog提供了查重功能,以便提高检索效率和降低检索赏用。
2. 《工程索引 (Ei Compendex PIus)》数据库光盘
1)简介
《工程索引(Ei ComPendex PIus)》数据库光盘简称CoM—PENDEx数据库,是KR OnDisc for windows光盘系列中的一种光盘,由美国Knight—Ridder信息公司发行。这个数据库就是印刷本《The Engineering lndex)的光盘版,该光盘收录了自1970年以来的工程索引信息,内容包括空间技术、应用物理、生物医学仪器、化学工程、城市建设工程、环境工程、电子工程、能源技术、工程材料、海洋工程、机械工程、采矿和冶金、管理工程等。该光盘有DOS版、Windows版、Macintosh版等几种,以便适合不同的PC与操作系统。检索系统与数据一般在同一张光盘上,数据每月更新,检索系统的安装十分简单方便,几乎不需要更改任何系统参数,如果在DOS环境下检索,则不在硬盘上安装检索系统也可以,直接在光盘驱动器盘符下键入ONDISC命令,即可进入检索系统。该光盘上一般还附带有与Dialog联机的远程终端访问系统,时间跨度为19洲午主今。l 988年-1991年,各个年份的光盘检索系统工作在DOS平台上,1992年以后的检索系统工作在Windows平台上。1999年,Dialog公司推出了提供Web浏览方式的光盘数据库服务软件Dialog@site,购买并在本地装有Windows NT系统的服务器上安装运行Dialog@site软件后,即可通过局域网或因特网访问该数据库。它们的检索步骤和检索策略基本相同。COMPEND—EX数据库的特点是检索途径多,策略变换灵活,显示格式多,另外还有多种辅助分析手段,因而是工程技术领域最常用的数据库光盘。
3. 《中国学术期刊(光盘版)》全文数据库
1)简介
《中国学术期刊(光盘版)》全文数据库,简称CAJR数据库,是中国制作的第一个集成化、多功能型电子学术期刊数据库。这个数据库由清华大学主办,1996年起出版发行。CAJR数据库的特点是期刊全文入编,图文混排,显示、打印输出格式与印刷版期刊保持一致。对最新内容,数据库实行按月更新,以保证信息的及时性,对不在数据库重点收录范围的期刊文献(或称为过刊文献),陆续建立过期期刊题录摘要库,与现刊文献合并成同一光盘.可实现题录摘要的追溯查询。对重点学科的过期期刊,则可建立过期期刊全文回溯库,以实现全文追溯查询。在软件方面,CAJR数据库采用传统和智能化全文检索相结合的方案,保留了传统数据库检索的优点,增加了检索入口。
4. 中国知识资源总库简介 .
中国知网又称中国知识基础设施工程(China National knowledge infrastructure)是以实现全社会知识资源传播共享与增值利用为目标的国家信息化重点建设项目,于1995年正式立项。它由清华同方光盘股份有限公司、中国学术期刊(光盘版)电子杂志社、光盘国家工程研究中心等单位于1999年6月在《中国学术期刊光盘版)》(caj-cd)和中国期刊网.(CJN)全文数据库建设的基础上研制开发的一项规模更大、内容更广、结构更系统的知识信息化建设项目。
截止2007年底,cnki涵盖了国内9000多种期刊杂志,1500多种重要会议文献,420多家博士培养单位论文,650多家硕士培养单位论文,300多家出版社已经出版的图书、全国的重要报纸以及百科全书、专利、年鉴、标准、科技成果、政府文件、因特网信息汇总以及国内外上千个各类加盟数据库等知识资源。据相关统计,cnki已经被海内外17000多个高校、科研单位、医院、企业、政府;中小学等各类机构所采用,最终用户群超过2600万人。
5、基于Internet的信息检索
在Internet 上,www 信息资源的一般查询方法有:基于超文本的信息查询、基于目录的信息查询和基于搜索引擎的信息查询。
1.) 基于超文本的信息查询
通过超文本链接逐步遍历庞大的Internet,从一个www 服务器到另一个www 服务
器,从一个目录到另一个目录,从一篇文章到另一篇文章,浏览查找所需信息的方法称为浏览,也称基于超文本的信息查询方法。
基于超文本的浏览模式是一种有别于传统信息检索技术的新型检索方式,它已成为Internet 上最基本的查询模式。利用浏览模式进行检索时,用户只需以一个节点作为入口,根据节点中文本的内容了解嵌入其中的热链指向的主题,然后选择自己感兴趣的节点进一步搜索。在搜索过程中,用户会发现许多相关的节点内容根本没被自己所预想到,而是在浏览过程中不断蹦出来,提醒用户注意它。
随着 www 服务器的急剧增加,通过一步步浏览来查找所需信息已非常困难。为帮助用户快速方便地搜寻所需信息,各种www 信息查询工具便应运而生,其中最有代表性的是基于目录和基于搜索引擎的信息查询工具,而利用这些工具来查找信息的方法就被称为基于目录和基于搜索引擎的信息查询方法。
2). 基于目录的信息查询
为了帮助Internet 上用户方便地查询到所需要的信息,人们按照图书馆管理书目的方法设置了目录。网上目录一般以主题方式来组织,大主题下又包括若干小主题,这样一层一层地查下去,直到比较具体的信息标题。目录存放在www 服务器里,各个主题通过超文本的方式组织在一起,用户通过目录最终可得到所需信息的网址,即可到相应的地方查找信息,这种通过目录帮助的方法获得所需信息的网址继而查找信息的方法称为基于目录的信息查询方法。
有许多机构专门收集Internet 上的信息地址,并编制成目录提供给网上用户。Yahoo就是一个非常著名的基于目录帮助的网址,其目录按照一般主题组织,顶层按经济、计算机、教育、政治、新闻、科学等分成14 大类目录,每一大类又分成若干子类,层层递进。
3). 基于搜索引擎的信息查询
搜索引擎又称www 检索工具,是www 上的一种信息检索软件。www 检索工具的工
作原理与传统的信息检索系统类似,都是对信息集合和用户信息需求集合的匹配和选择。基于搜索工具的检索方法接近于我们通常所熟悉的检索方式,即输入检索词以及各检索词之间的逻辑关系,然后检索软件根据输入信息在索引库中搜索,获得检索结果(在Internet 上是一系列节点地址)并输出给用户。
搜索引擎实际上是Internet 的服务站点,有免费为公众提供服务的,也有进行收费服务的。不同的检索服务可能会有不同界面,不同的侧重内容,但有一点是共同的,就是都有一个庞大的索引数据库。这个索引库是向用户提供检索结果的依据,其中收集了Internet 上数百万甚至数千万主页信息,包括该主页的主题、地址,包含于其中的被链接档主题,以及每个文档中出现的单词的频率、位置等。最著名的搜索引擎莫过于Google和百度了。
声明:你问我答网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系fangmu6661024@163.com