第二章 信息检索概述PPT讲稿.ppt

上传人:石*** 文档编号:70738272 上传时间:2023-01-27 格式:PPT 页数:52 大小:1.74MB
返回 下载 相关 举报
第二章 信息检索概述PPT讲稿.ppt_第1页
第1页 / 共52页
第二章 信息检索概述PPT讲稿.ppt_第2页
第2页 / 共52页
点击查看更多>>
资源描述

《第二章 信息检索概述PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第二章 信息检索概述PPT讲稿.ppt(52页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第二章第二章信息检索概述信息检索概述第1页,共52页,编辑于2022年,星期二一、介绍几个与信息相关的概念一、介绍几个与信息相关的概念 1 1 知识经济知识经济:“知识经济知识经济”是指建立在知识信息的生产、是指建立在知识信息的生产、分配、使用之上的经济。分配、使用之上的经济。“知识经济知识经济”是和是和农业经济、工业经济相对应的一个概念,它农业经济、工业经济相对应的一个概念,它指的是当今世界一种新类型的,富有生命力指的是当今世界一种新类型的,富有生命力的经济。的经济。第2页,共52页,编辑于2022年,星期二2信息高速公路信息高速公路(InformationHighway)w是美国国家信息基

2、础设施(National Information Infrastructure,简称NII)的代称。它实际上是一条很宽的信息通道,可供人们大量地,并行地,高速地传输信息。具体地说,它是一个巨型的交互式多媒体高速计算机通信网络系统,将原来分散的电话,计算机,电视,广播,传真,数据库等传输系统集成为一体,形成以现代计算机网络通信技术为基础,以光导纤维通信和卫星通信为骨干,以数据库为信息源,跨越全国乃至世界的双向大容量,高速度的电子数据(数字化数据-Digital Data)传输系统。由于这种交互式电脑网络如同交通基础设施的高速公路网,所以被人们形象的称为“信息高速公路”。第3页,共52页,编辑于2

3、022年,星期二目前有:目前有:(1)美国信息高速公路计划)美国信息高速公路计划(NII)最早是最早是1979年由戈尔提出,年由戈尔提出,1992年克林顿竞选美国总统时正式提出年克林顿竞选美国总统时正式提出这个构想。后来成为克林顿上台后大力推崇的重振美国经济计划这个构想。后来成为克林顿上台后大力推崇的重振美国经济计划的重要组成部分。它的提出不仅在美国社会产生了强烈的反响,的重要组成部分。它的提出不仅在美国社会产生了强烈的反响,而且也在全球范围内引起巨大的震动。而且也在全球范围内引起巨大的震动。(2)全球信息高速公路计划)全球信息高速公路计划(GII)是美国政府是美国政府NII计划的扩大与延伸。

4、目的是把各国光纤和卫星通讯计划的扩大与延伸。目的是把各国光纤和卫星通讯网连接在一起,发展扩大到全世界范围的网连接在一起,发展扩大到全世界范围的“全球信息高速公路全球信息高速公路”计划。计划。第4页,共52页,编辑于2022年,星期二w(3)法国的)法国的“电子信息高速公路电子信息高速公路”:以多媒体取代家用电脑的:以多媒体取代家用电脑的庞大工程,将把电话同通信网络相连接,最终形成一个光纤电视庞大工程,将把电话同通信网络相连接,最终形成一个光纤电视网,从而实现法国境内文字、声音和图象的快速传递网,从而实现法国境内文字、声音和图象的快速传递w(4)韩国也准备用)韩国也准备用21年的时间,投资年的时

5、间,投资550亿美元,建立本国的超亿美元,建立本国的超高速信息通信网。高速信息通信网。(5)新加坡的智能岛)新加坡的智能岛东南亚信息中心东南亚信息中心w(6)日本的曼佗罗计划()日本的曼佗罗计划(1992/5)与)与NII相抗衡的全面战略计相抗衡的全面战略计划划w(7)中国信息高速公路计划)中国信息高速公路计划(信息准高速国道或信息中速国道):信息准高速国道或信息中速国道):“三金三金”工程,即工程,即“金桥金桥”,“金关金关”,“金卡金卡”工程。(十二金工程)工程。(十二金工程)第5页,共52页,编辑于2022年,星期二w三金工程是中国三金工程是中国“信息高速公路)的起步工程信息高速公路)的

6、起步工程w金桥工程是一项规模巨大的系统工程,是以电子邮件金桥工程是一项规模巨大的系统工程,是以电子邮件(E-MAIL)和电子数据交换()和电子数据交换(EDI)作为信息交换平)作为信息交换平台,主要目标是建立一个覆盖全国与国务院各部委使台,主要目标是建立一个覆盖全国与国务院各部委使用网相联,并与各省、直辖市、自治区中心城市、大用网相联,并与各省、直辖市、自治区中心城市、大中型企业连接的国家公用信息通讯网。中型企业连接的国家公用信息通讯网。w金卡工程也称电子货币工程。我国始与金卡工程也称电子货币工程。我国始与1993年,上海年,上海等等12个城市为首批试点城市。武汉市列为第二批试点个城市为首批试

7、点城市。武汉市列为第二批试点城市,城市,1997年启动后,得到中国人民银行总行批准年启动后,得到中国人民银行总行批准。w金关工程是我国实现对外贸易无纸化的信息网络工金关工程是我国实现对外贸易无纸化的信息网络工程。程。第6页,共52页,编辑于2022年,星期二3、InternetwInternet又称因特网或又称因特网或“互联网互联网”,他是从英文,他是从英文InterconnectedNetworks这两个词中,各取前半部合成的。其中文意思是指跨这两个词中,各取前半部合成的。其中文意思是指跨国的网络,是一群横跨世界的各种相互连接的计算机网络的统称,国的网络,是一群横跨世界的各种相互连接的计算机

8、网络的统称,这些网络集合采用一种共同的标准通信协议来沟通,以进行信息这些网络集合采用一种共同的标准通信协议来沟通,以进行信息资源的交换和共享。资源的交换和共享。wInternet是由美国是由美国ARPANET发展起来的一个国际性的计算机发展起来的一个国际性的计算机互联网络,它的特点是(互联网络,它的特点是(1)异种计算机互联()异种计算机互联(2)互联网络部)互联网络部分遭到破坏时,其他部分仍可以继续应用。分遭到破坏时,其他部分仍可以继续应用。wInternet可以总结为:是遵从可以总结为:是遵从TCP/IP协议,遍布全世界的大大协议,遍布全世界的大大小小的计算机网络连接起来构成的全球性计算机

9、网络的总称,小小的计算机网络连接起来构成的全球性计算机网络的总称,是目前全球最大的计算机网络,也是全球最大的信息资源网。是目前全球最大的计算机网络,也是全球最大的信息资源网。是是“信息高速公路信息高速公路”的典范。的典范。wInternet网的主要功能就是进行科技信息的传递网的主要功能就是进行科技信息的传递。第7页,共52页,编辑于2022年,星期二特点:特点:信息广泛、传播速度快、方便实用信息广泛、传播速度快、方便实用应用:应用:信息查询、收发信息查询、收发E-MAIL、传送文件、传送文件、WWW应用、应用、Gopher-信息检索信息检索Telnet-远程登录、远程登录、BBS公告牌服务公告

10、牌服务 第8页,共52页,编辑于2022年,星期二 Gopher是美国明尼苏达大学研制的菜单式信息查询软件。WALS(广域服务器)是供用户查询分布在Internet网上各类数据库的一个通用接口软件,实现远程查询。WWW是一个超文本式信息查询工具,它可以把Internet网上不同地点的相关数据信息有机的组织在一起。用户只要提供查询要求就可以了。第9页,共52页,编辑于2022年,星期二四大骨干网四大骨干网w目前我国已建成Chinanet、CERnet、CSTnet与ChinaGBN 四大骨干网。各部门与单位纷纷建立了与四大骨干网互联的内部网或局域网。第10页,共52页,编辑于2022年,星期二

11、Chinanet(中国公用计算机互联网)是中国第一个商(中国公用计算机互联网)是中国第一个商业化全国性计算机网络,该网由信息产业部(原邮电业化全国性计算机网络,该网由信息产业部(原邮电部)管理部)管理CERnet(中国教育与科研计算机网络)由教育部主持,中国教育与科研计算机网络)由教育部主持,网控中心设在清华大学,网络分为全国主干网、地区网控中心设在清华大学,网络分为全国主干网、地区网与校园网三层结构。主干网连着八大区、十个节点,网与校园网三层结构。主干网连着八大区、十个节点,所有主干网节点采用所有主干网节点采用11条条DDN专线连接。是目前中国专线连接。是目前中国与与Internet连接最大

12、的学术网。连接最大的学术网。第11页,共52页,编辑于2022年,星期二CSTnet(中国科技网)由中国科学院主管,以中国科中国科技网)由中国科学院主管,以中国科学院的中国国家计算机和网络设施学院的中国国家计算机和网络设施NCFC与全国性与全国性网络网络CASnet为基础,连接中国科学院以外的国内科为基础,连接中国科学院以外的国内科技单位而构成的网络。技单位而构成的网络。ChinaGBN(中国金桥网)即国家经济信息通讯网,(中国金桥网)即国家经济信息通讯网,是一个商业化信息网络,由中国电子工业总公司是一个商业化信息网络,由中国电子工业总公司(原电子工业部)主管。(原电子工业部)主管。第12页,

13、共52页,编辑于2022年,星期二4、信息社会的基本内容:、信息社会的基本内容:3I、3C、3A、3R3I:Information(信息)、Intelligence(智能)、Integration(集成、综合)3C:Computer(计算机)、Communication(通讯)、Control(控制)3A:Factory Automation(工厂自动化)、Office Automation(办公自动化)Home Automation(家庭自动化)3R:Material Revolution(材料革命)、Energy Revolution(能源革命)、Information Revolutio

14、n(信息革命)第13页,共52页,编辑于2022年,星期二5、信息、知识、情报、文献的基本含义、信息、知识、情报、文献的基本含义信息:信息:在中国历史文献中最早见于唐诗,拉丁词源是在中国历史文献中最早见于唐诗,拉丁词源是Information。每个人每天都在不断地通过感觉器官从外。每个人每天都在不断地通过感觉器官从外界接受信息。书刊报纸、电视、收音机、交谈中不断获界接受信息。书刊报纸、电视、收音机、交谈中不断获得信息。得信息。信息的准确概念,尚未定论,众说纷纭。信息的准确概念,尚未定论,众说纷纭。信息存在于人类社会以及人的思维活动,也存在于自信息存在于人类社会以及人的思维活动,也存在于自然界。

15、然界。第14页,共52页,编辑于2022年,星期二信息的特点信息的特点:(1)时效性:重要特点。如果信息传递很慢,那么有用的信息时效性:重要特点。如果信息传递很慢,那么有用的信息也会失去应有的价值。如新闻、预告。也会失去应有的价值。如新闻、预告。(2)可扩散性:在时间或空间上从一点转移到另一点。可扩散性:在时间或空间上从一点转移到另一点。“一传一传十,十传百十,十传百”。(3)可扩充性:人们对世界认识是无无限的,因此信息资源的可扩充性:人们对世界认识是无无限的,因此信息资源的扩充与累积也是无限的。扩充与累积也是无限的。(4)共享性:信息可以多次传播,不失其内容,与实物交易不共享性:信息可以多次

16、传播,不失其内容,与实物交易不同。同。第15页,共52页,编辑于2022年,星期二 知识:知识:知识是人类认识的成果和结晶,是人类在认识和改造世知识是人类认识的成果和结晶,是人类在认识和改造世界和社会实践中获得的对事物本质的认识。知识仅存在于人界和社会实践中获得的对事物本质的认识。知识仅存在于人类社会。类社会。个人知识个人知识:存在于大脑、笔记或书信中,只能为个人所:存在于大脑、笔记或书信中,只能为个人所用。用。社会知识社会知识:存在于文献中或人类的传说中。:存在于文献中或人类的传说中。知识的属性:意识性、实践性、规律性、继承性,渗透知识的属性:意识性、实践性、规律性、继承性,渗透性。性。第1

17、6页,共52页,编辑于2022年,星期二情报情报:是一种人工信息,信息与知识都是它的来源。激活了的,是一种人工信息,信息与知识都是它的来源。激活了的,活化了的知识。活化了的知识。情报与信息在英文中同为情报与信息在英文中同为Information,但信息的外延,但信息的外延比情报广,信息是包含情报的。情报就是人们在一定时间内比情报广,信息是包含情报的。情报就是人们在一定时间内为一定目的而传递的有使用价值的知识或信息,它有明确的为一定目的而传递的有使用价值的知识或信息,它有明确的接收对象。接收对象。情报的属性情报的属性:知识与信息性、动态性、效用性、社会性、语:知识与信息性、动态性、效用性、社会性

18、、语言性、可塑性、时间性。言性、可塑性、时间性。第17页,共52页,编辑于2022年,星期二文献:文献:记录有知识的一切载体。即用文字、图形、符号、声频、记录有知识的一切载体。即用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体。属性:知识性、视频等技术手段记录人类知识的一种载体。属性:知识性、记录性、物质性。记录性、物质性。文献的范围很广。文献的范围很广。古代:甲骨文、碑刻、竹简、帛书是文献。古代:甲骨文、碑刻、竹简、帛书是文献。现代:图书、报纸、期刊现代:图书、报纸、期刊现今:机读资料、缩微制品、电子出版物。现今:机读资料、缩微制品、电子出版物。文献的功能文献的功能1)存贮知识

19、的功能;存贮知识的功能;2)传递和交流信息的功能;传递和交流信息的功能;3)保存知识的功能。保存知识的功能。第18页,共52页,编辑于2022年,星期二二、信息检索的基本内容二、信息检索的基本内容1、概念:1)信息检索(information retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。所以,它的全称又叫信息存储与检索(information storage and retrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。相当于我们所说的信息查询(information search

20、)。第19页,共52页,编辑于2022年,星期二w2)检索语言:检索语言是把信息的存储与检索联系起)检索语言:检索语言是把信息的存储与检索联系起来,把标引人员与用户联系起来,以便取得共同的理来,把标引人员与用户联系起来,以便取得共同的理解、实现交流的语言。有人工语言(主题语言和分类解、实现交流的语言。有人工语言(主题语言和分类语言)、自然语言之分。语言)、自然语言之分。(第三章详细介绍)第三章详细介绍)3)检索方法:常用法、追溯法和循环法)检索方法:常用法、追溯法和循环法(第四章详细介绍)第四章详细介绍)第20页,共52页,编辑于2022年,星期二4)检索词、检索式、检索策略检索词、检索式、检

21、索策略(第四章详细介绍)第四章详细介绍)检索词是用户或检索人员给出的字、词、字符或短检索词是用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录。语,用于查找含有它(它们)的记录。检索式也称检索提问式,是要求系统执行的检索语检索式也称检索提问式,是要求系统执行的检索语句。简单的检索式由一个检索词和一个字段名构成,复句。简单的检索式由一个检索词和一个字段名构成,复杂的检索式由多个检索词和字段名通过关系算符连接而杂的检索式由多个检索词和字段名通过关系算符连接而成。如:要利用英文搜索引擎查找网络信息检索方面的成。如:要利用英文搜索引擎查找网络信息检索方面的资料,检索式为(资料,检索式

22、为(WebORInternetORWWW)AND(Search*ORRetrieval*)。)。第21页,共52页,编辑于2022年,星期二检索策略:检索策略:所谓检索策略,就是在分析课题内容具有哪些所谓检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、学科领域、检概念单元的基础上,确定检索系统、学科领域、检索文档、检索途径和检索词,并科学安排各检索词索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。也就之间的位置关系和逻辑关系以及查找步骤等。也就是为满足信息需求所制定的一系列检索方案。是为满足信息需求所制定的一系列检索方案。第22页,共52

23、页,编辑于2022年,星期二w5)检中结果、查全率、查准率检中结果、查全率、查准率(第四章详细介绍)第四章详细介绍)检中结果又称检索结果集,是数据库中满足检中结果又称检索结果集,是数据库中满足(检索式(即检索式(即符合检索条件)的那些记录的集合符合检索条件)的那些记录的集合查全率:是指检出文献中合乎需要的文献数量占数据库查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例中存在的合乎该需要的所有文献的比例查准率:是指检出文献中合乎需要的文献数量占检出文查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例献全部数量的比例第23页,共52页,编辑于2022

24、年,星期二2、信息检索的类型、信息检索的类型:(1)根据检索手段的不同,分为手工检索、计算机检根据检索手段的不同,分为手工检索、计算机检索(光盘检索、联机检索和网络检索)索(光盘检索、联机检索和网络检索)(2)根据检索对象、根据检索对象、形式的不同,分为文献型信息检索、数据型信息检形式的不同,分为文献型信息检索、数据型信息检索、事实型信息检索。索、事实型信息检索。第24页,共52页,编辑于2022年,星期二 文献型信息检索(文献型信息检索(DocumentRetrieval):以文献(包括题录、文摘)为检索以文献(包括题录、文摘)为检索对象对象的检索。的检索。凡是查找某一主题、时代、地区、著者

25、、文种凡是查找某一主题、时代、地区、著者、文种的有关文献,以及回答这些文献的出处和收藏的有关文献,以及回答这些文献的出处和收藏处所等,都属于文献型信息检索的范畴。完成处所等,都属于文献型信息检索的范畴。完成文献型信息检索主要借助于各种书目型数据库。文献型信息检索主要借助于各种书目型数据库。第25页,共52页,编辑于2022年,星期二w数据型信息检索(数据型信息检索(DataRetrieval):以数值或数:以数值或数据为对象的一种检索,包括文献中的某一数据、据为对象的一种检索,包括文献中的某一数据、公式、图表,以及某一物质的化学分子式等,数公式、图表,以及某一物质的化学分子式等,数据检索分为数

26、值型与非数值型。完成数据型信息据检索分为数值型与非数值型。完成数据型信息检索主要借助于各种数值数据库和统计数据库。检索主要借助于各种数值数据库和统计数据库。第26页,共52页,编辑于2022年,星期二w事实型信息检索(事实型信息检索(FactRetrieval):以某一客观事:以某一客观事实为检索对象,查找某一事物发生的时间、地点实为检索对象,查找某一事物发生的时间、地点及过程的检索,其检索结果主要是客观事实或为及过程的检索,其检索结果主要是客观事实或为说明事实而提供的相关资料。如:说明事实而提供的相关资料。如:2001年年7月通月通过的奥运会主办城市的结果与过程。完成事实型过的奥运会主办城市

27、的结果与过程。完成事实型信息检索主要借助于各种指南数据库和全文数据信息检索主要借助于各种指南数据库和全文数据库。库。第27页,共52页,编辑于2022年,星期二3、信息检索的发展历程、信息检索的发展历程3.1基本方向基本方向:手工检索向计算机检索:手工检索向计算机检索(如穿如穿孔、缩微、自动化孔、缩微、自动化)发展,但是手工检索与发展,但是手工检索与计算机检索将长期并存。因为计算机检索有计算机检索将长期并存。因为计算机检索有其缺陷:其缺陷:(1)硬件条件不足:没有计算机,不硬件条件不足:没有计算机,不能上网,能上网,(2)数据库不完善,数据库不完善,(3)网络慢或网网络慢或网络故障等等。络故障

28、等等。第28页,共52页,编辑于2022年,星期二3.2计算机信息检索的的产生和发展,分为五个阶段:(1)脱机批处理检索:1954一64。定期由专职检索人员把许多用户课题汇总,批量处理提问要求,并把结果提供给用户。直接在计算机旁检索,不需要远程终端设备及通信网络。用户在计算机处理成批检索课题之后才知道检索结果,不能直接、及时修改检索策略,查全率和查准率受到一定限制。第29页,共52页,编辑于2022年,星期二(2)联机情报检索:20世纪70年代投入商业运营。用户在计算机检索系统的终端上,通过通信网络,使用特定的指令和算符,以人机对话方式,查询远程计算机检索系统核心的数据库,从中获取所需信息的计

29、算机检索系统。第30页,共52页,编辑于2022年,星期二联机检索系统由三个部分组成联机检索系统由三个部分组成:主机系统、通讯系统和终:主机系统、通讯系统和终端设备端设备 主机系统是联机检索系统的核心,它具备处理速度快、多道程序和分时功能,内存容量大,多样化的输入输出设备。通讯系统是指终端设备与主机系统进行通信的设备。通信线路分为两种:专用的直达线路;通过拨号选择对方的交换线路。前者是特定通信线路,后者使用电话网和用户电报网,联机系统使用的通信线路就属于后一种。终端系统是人与系统的接口设备。它能将字符、声音以及人类的信息表现形式转换成系统的机器代码。反之,将系统的结果还原成字符、声音等形式,传

30、送给终端用户。第31页,共52页,编辑于2022年,星期二(3)国际联机检索国际联机检索:70年代中后期年代中后期国际联机检索是指用户利用终端设备,国际联机检索是指用户利用终端设备,通过通信网与地球上任何地方的大型通过通信网与地球上任何地方的大型计算机信息检索系统的主机进行直接计算机信息检索系统的主机进行直接人机对话式的计算机检索人机对话式的计算机检索。第32页,共52页,编辑于2022年,星期二w国际联机检索系统一般由通信网络、国际联机检索中心、用户终端等三部分组成。w 国际联机检索系统的服务方式有:回溯检索、定题服务、联机订购原文、电子邮件服务以及光盘服务五种方式。第33页,共52页,编辑

31、于2022年,星期二几种主要的国际联机检索系统wDialog国际联机检索系统国际联机检索系统wESA/IRS国际联机检索系统国际联机检索系统wORBIT国际联机检索系统国际联机检索系统wSTN国际联机检索系统国际联机检索系统wOCLC国际联机检索系统国际联机检索系统这是目前世界著名的五大联机检索系统这是目前世界著名的五大联机检索系统第34页,共52页,编辑于2022年,星期二 目前世界上最大的国际联机检索信息系统。总目前世界上最大的国际联机检索信息系统。总部设在美国旧金山附近的帕洛部设在美国旧金山附近的帕洛阿尔托市。此系统现阿尔托市。此系统现有近有近600个数据库,信息总量超过个数据库,信息总

32、量超过5亿条,其中包括亿条,其中包括50多种语言、多种语言、6万多种期刊,数据库内容涉及综合性学科、万多种期刊,数据库内容涉及综合性学科、自然科学、应用科学和社会科学等,文献类型有图书、自然科学、应用科学和社会科学等,文献类型有图书、报纸、期刊、学位论文、会议录研究报告、政府文件、报纸、期刊、学位论文、会议录研究报告、政府文件、专利文献、标准文献、年鉴、市场行情和厂商名录等。专利文献、标准文献、年鉴、市场行情和厂商名录等。DIALOG第35页,共52页,编辑于2022年,星期二ORBIT ORBIT的全称为的全称为onlineretrievalofbibliographicinformatio

33、ntimeshared即文献目录信息分时联机检索。即文献目录信息分时联机检索。是第二大国际联机检索系统,拥有是第二大国际联机检索系统,拥有200多个数据库。以多个数据库。以化工、石油、生物、化学、环境科学、医学、运动科学化工、石油、生物、化学、环境科学、医学、运动科学和安全科学等深入文献比较齐全而著称。其特色数据库和安全科学等深入文献比较齐全而著称。其特色数据库有有SAE(汽车、飞机等交通工具)(汽车、飞机等交通工具)TULSA(石油、天(石油、天然气开采与勘探)等然气开采与勘探)等30多个数据库,为该系统独有。多个数据库,为该系统独有。第36页,共52页,编辑于2022年,星期二ESA/IR

34、S是欧洲最大的联机检索中心。也是世界上大型的是欧洲最大的联机检索中心。也是世界上大型的国际联机检索系统之一,仅次于美国的国际联机检索系统之一,仅次于美国的DIALOG和和ORBIT联机检索系统。联机检索系统。涉及的专业范围有:科技、农业、卫生、管理、社会涉及的专业范围有:科技、农业、卫生、管理、社会科学和宇航工程及技术等方面。有科学和宇航工程及技术等方面。有120多个数据库,其中,多个数据库,其中,酸雨(酸雨(ACIDRAIN)、铸造()、铸造(BIIPAM-CTIF)、原材料)、原材料价格价格(PRICEDATA)、卫星遥感图象()、卫星遥感图象(LEDA)、宇航)、宇航及高技术软件(及高技

35、术软件(SPACESOFT)等为特色数据库。)等为特色数据库。第37页,共52页,编辑于2022年,星期二STN STN(TheScientificandTechnicalInformationNetworkInternational)是国际科学技术信息网络系统的简称。是由德国卡尔斯鲁是国际科学技术信息网络系统的简称。是由德国卡尔斯鲁厄能源、物理、数学专业信息中心(厄能源、物理、数学专业信息中心(FIT)、美国化学文摘社()、美国化学文摘社(CAS)和日本国际化学信息协会(和日本国际化学信息协会(JAICI)三家合作经营的国际联机检索系)三家合作经营的国际联机检索系统。统。涉及的专业范围:化学

36、、化工、生物、医学、数学、物理、能源、涉及的专业范围:化学、化工、生物、医学、数学、物理、能源、冶金、建筑等方面。其特色数据库有:冶金、建筑等方面。其特色数据库有:CAS化学物质结构图形数据库化学物质结构图形数据库(REGISTRY)、德国专利数据库()、德国专利数据库(PATDPA)、碳)、碳13核磁共振和核磁共振和红外光谱数值图形数据库(红外光谱数值图形数据库(C13-NMR/IR)。)。第38页,共52页,编辑于2022年,星期二STN的特点w合作建网,分布式管理合作建网,分布式管理w多文档检索,方便实用多文档检索,方便实用w字段限定检索时,只使用后缀码,无前缀码字段限定检索时,只使用后

37、缀码,无前缀码w拥有世界上第一批联机图象数据库拥有世界上第一批联机图象数据库第39页,共52页,编辑于2022年,星期二OCLC OCLC(OnlineComputerLibraryCenter)即联即联机计算机图书馆中心。是世界上最大的文献信息服务机机计算机图书馆中心。是世界上最大的文献信息服务机构之一。总部设在美国俄亥俄州,构之一。总部设在美国俄亥俄州,1971年建成联机系年建成联机系统,拥有统,拥有370多种语言、多种语言、3400多万条联合书目记录数多万条联合书目记录数据库,据库,OCLC的的“第一检索系统第一检索系统”(FirstSearch)提提供联机信息检索系统目前有供联机信息检

38、索系统目前有70多个数据库,涉及多个数据库,涉及13个个主题领域。不仅有书目信息而且绝大部分可以直接获主题领域。不仅有书目信息而且绝大部分可以直接获取全文。取全文。第40页,共52页,编辑于2022年,星期二(4)光盘检索光盘检索:80年代初期,其全称为高密年代初期,其全称为高密度光盘度光盘(CompactDisk),主要是利用激光、,主要是利用激光、计算机及光电集成等技术实现信息存储的数计算机及光电集成等技术实现信息存储的数字化。以光盘为介质的光盘数据库检索系统字化。以光盘为介质的光盘数据库检索系统由于信息存储量大,简单易用而取胜。由于信息存储量大,简单易用而取胜。第41页,共52页,编辑于

39、2022年,星期二(5)网络信息检索网络信息检索:网络信息检索是通过标准通信方式将世界各地的计算机网络信息检索是通过标准通信方式将世界各地的计算机网络连接起来,形成一个基于客户机网络连接起来,形成一个基于客户机-服务器模式的网络分布服务器模式的网络分布数据库结构。它在全球范围内把科技信息、商贸信息、经济数据库结构。它在全球范围内把科技信息、商贸信息、经济信息、时事新闻以及日常生活信息通过互联网络合在一起,信息、时事新闻以及日常生活信息通过互联网络合在一起,向亿万联网用户提供广泛的信息检索与服务。它是信息化社向亿万联网用户提供广泛的信息检索与服务。它是信息化社会应用最广泛、最活跃的领域。会应用最

40、广泛、最活跃的领域。第42页,共52页,编辑于2022年,星期二网络信息检索服务的特点:网络信息检索服务的特点:1)信息检索服务的开放性)信息检索服务的开放性。网络信息系统中包含信息资源、信息。网络信息系统中包含信息资源、信息设备、信息通道、信息检索软件及信息终端等子系统,各个子系统都是设备、信息通道、信息检索软件及信息终端等子系统,各个子系统都是开放的,其信息资源面向所有用户。开放的,其信息资源面向所有用户。2)超文本的多链接性)超文本的多链接性。以超文本技术为基础链结构将不同地方。以超文本技术为基础链结构将不同地方的相关信息有机联系起来,使用户可通过点击文本或图表中的超的相关信息有机联系起

41、来,使用户可通过点击文本或图表中的超文本链接点访问另一个相关的文档。文本链接点访问另一个相关的文档。3)操作的简易性)操作的简易性。采用客户机。采用客户机/服务器结构,通过交互式的图形界服务器结构,通过交互式的图形界面,为用户提供友好的信息查询要求,系统就会自动向适当的服务面,为用户提供友好的信息查询要求,系统就会自动向适当的服务器提出请求。正是这一特点,使器提出请求。正是这一特点,使Internet能广泛深入学校、家庭、办公能广泛深入学校、家庭、办公室乃至每一个人。室乃至每一个人。第43页,共52页,编辑于2022年,星期二4、网络信息检索的发展趋势、网络信息检索的发展趋势智能化智能化可视化

42、可视化简单化简单化多样化多样化个性化个性化商业化商业化第44页,共52页,编辑于2022年,星期二(1)智能化智能化智能化是网络信息检索未来主要的发展方向。智能检索是智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜语言表述的检索要求进行分析,而后形成检索策略进行搜索。索。目前已有一些搜索引擎支持智能检索,但其智能化程度不目前已有一些搜索引擎支持智能检索,但其智能化程度不高。而近年来高。而近年来internet上不断涌现的人工智能产品,如智上不断

43、涌现的人工智能产品,如智能搜索引擎、智能浏览器、智能代理、知识共享智能体能搜索引擎、智能浏览器、智能代理、知识共享智能体等,都将提高网络信息检索的智能化程度。等,都将提高网络信息检索的智能化程度。第45页,共52页,编辑于2022年,星期二(2)可视化可视化可视化的优点在于图象的表达方式生动、形象、准确、效可视化的优点在于图象的表达方式生动、形象、准确、效果更高,能从多角度揭示,而纯文字的表达方式是模糊、果更高,能从多角度揭示,而纯文字的表达方式是模糊、一维的。一维的。信息检索中的可视化是将数据库中不可见的语义关系用图信息检索中的可视化是将数据库中不可见的语义关系用图象形式可视化显示并表达用户

44、检索过程。在可视化空间展象形式可视化显示并表达用户检索过程。在可视化空间展示的信息可以看见它们是二维的或三维的。(信息检索中,示的信息可以看见它们是二维的或三维的。(信息检索中,实现语义控制是人们的理想,而现实的信息检索是基于实现语义控制是人们的理想,而现实的信息检索是基于“字符串字符串”的检索、匹配与表达)的检索、匹配与表达)第46页,共52页,编辑于2022年,星期二(3)简单化简单化未来家用电脑将朝着智能化、网络化、人性化和绿未来家用电脑将朝着智能化、网络化、人性化和绿色环保的方向发展;操作系统的用户友好性将不断色环保的方向发展;操作系统的用户友好性将不断增加,如微软和苹果公司都在致力于

45、操作系统网络增加,如微软和苹果公司都在致力于操作系统网络化研究,以便使其中的任意应用程序都能化研究,以便使其中的任意应用程序都能“连接连接”进进行行“网络检索网络检索”,并与网络,并与网络“交互交互”;各搜索引擎检索;各搜索引擎检索界面更加界面更加“傻瓜化傻瓜化”,使用户学习和进行网络信息,使用户学习和进行网络信息检索更加容易;网上自动标引、自动文摘、自动跟检索更加容易;网上自动标引、自动文摘、自动跟踪、自动漫游、机器翻译、多媒体技术、动态链技踪、自动漫游、机器翻译、多媒体技术、动态链技术、数据挖掘和信息推拉等技术逐步发展、完善,术、数据挖掘和信息推拉等技术逐步发展、完善,会越来越方便用户及时

46、准确的检索信息。这些硬件会越来越方便用户及时准确的检索信息。这些硬件与软件技术的发展都有利于网络信息检索的简单化。与软件技术的发展都有利于网络信息检索的简单化。第47页,共52页,编辑于2022年,星期二(4)多样化多样化多样化首先表现在可以检索的信息形态多样化,如文本、声多样化首先表现在可以检索的信息形态多样化,如文本、声音、图象、动画。音、图象、动画。多样化的第二个表现是检索工具向多国化、多语种化方向发多样化的第二个表现是检索工具向多国化、多语种化方向发展。展。AltaVista不仅提供了包括中文在内的不仅提供了包括中文在内的25种语言检索种语言检索系统,还提供仂种拉丁语系的语言与英语互译

47、的功能。系统,还提供仂种拉丁语系的语言与英语互译的功能。Google,Yahoo!,!,HotBot,LycosExcite和和WebCrawler都在世界各地设立了分支机构,使检索服都在世界各地设立了分支机构,使检索服务本地化;并增加服务器,分流用户,提高上网查询务本地化;并增加服务器,分流用户,提高上网查询速度。速度。多样化的第三个表现是网上检索工具的的服务多元化,多样化的第三个表现是网上检索工具的的服务多元化,为用户提供全方位的服务。(不是单纯的检索工具)为用户提供全方位的服务。(不是单纯的检索工具)第48页,共52页,编辑于2022年,星期二(5)个性化个性化个性化指各网站贯彻以用户为

48、中心的个性化指各网站贯彻以用户为中心的理念理念,注重内容的特色化和注重个性化注重内容的特色化和注重个性化的服务。的服务。第49页,共52页,编辑于2022年,星期二(6)商业化商业化网络检索系统不再仅仅是一种检索工具,而且成为一项产网络检索系统不再仅仅是一种检索工具,而且成为一项产业,它的商业利益成为推动系统完善和扩展的主要动力,业,它的商业利益成为推动系统完善和扩展的主要动力,网络信息的检索与利用由公共性转向商业化网络信息的检索与利用由公共性转向商业化Infoseek是是第一个对网络信息检索收费的检索工具,但由于它在收第一个对网络信息检索收费的检索工具,但由于它在收费的同时未能为用户提供特殊

49、的高质量信息服务,不久费的同时未能为用户提供特殊的高质量信息服务,不久便自生自灭了。便自生自灭了。第50页,共52页,编辑于2022年,星期二w网络信息检索的的商业化还体现在联机和光网络信息检索的的商业化还体现在联机和光盘检索逐渐进入网络环境。由于目前的网络盘检索逐渐进入网络环境。由于目前的网络信息检索检准率低,联网的收费联机和光盘信息检索检准率低,联网的收费联机和光盘检索依旧受到青睐,如世界著名的检索依旧受到青睐,如世界著名的DIALOG、OCLC、EBSCO、Silverplatter,国内的万,国内的万方数据资源系统、中国学术期刊光盘、重庆方数据资源系统、中国学术期刊光盘、重庆维普公司系列光盘都纷纷在网上设立自己的维普公司系列光盘都纷纷在网上设立自己的网络检索入口。网络检索入口。第51页,共52页,编辑于2022年,星期二思考题v信息和情报两个概念的共性及特性。信息和情报两个概念的共性及特性。v什么是文献?什么是文献?v在图书馆的电子资源中有哪些数据库属于文在图书馆的电子资源中有哪些数据库属于文献型数据库(书目题录文摘型数据库),哪些献型数据库(书目题录文摘型数据库),哪些数据库属于事实型数据库(全文型数据库)。数据库属于事实型数据库(全文型数据库)。v世界著名的国际联机检索系统有哪些?世界著名的国际联机检索系统有哪些?第52页,共52页,编辑于2022年,星期二

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com