1.3.1因特网中的信息检索.ppt

上传人:s****8 文档编号:93085746 上传时间:2023-06-28 格式:PPT 页数:17 大小:488KB
返回 下载 相关 举报
1.3.1因特网中的信息检索.ppt_第1页
第1页 / 共17页
1.3.1因特网中的信息检索.ppt_第2页
第2页 / 共17页
点击查看更多>>
资源描述

《1.3.1因特网中的信息检索.ppt》由会员分享,可在线阅读,更多相关《1.3.1因特网中的信息检索.ppt(17页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、例1:班上新来了一位外省的同学,我们决定向他介绍一下我们美丽的海南,并收集一些与海南相关的文字、图片等有关的材料。我们怎样才能快速而全面的收集所需要的材料呢?上网搜索用百度搜索1.3.1 因特网中的信息检索因特网中的信息检索 因特网信息资源广泛分布在整个网络之中,因特网信息资源广泛分布在整个网络之中,没有统一的管理机构,也没有统一的目录,这没有统一的管理机构,也没有统一的目录,这给使用和查找因特网信息资源带来了一定的难给使用和查找因特网信息资源带来了一定的难度,由此,搜索引擎(度,由此,搜索引擎(Sesrch EngineSesrch Engine)应运而)应运而生。生。搜索引擎是一种用于帮助

2、因特网用户查询搜索引擎是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组搜集、发现信息,对信息进行理解、提取、组织的处理,并为用户提供检索服务,从而起到织的处理,并为用户提供检索服务,从而起到信息导航的目的。信息导航的目的。1.目录索引类与全文搜索引擎目录索引类与全文搜索引擎 在检索中文文本资料时,经常使用的是目录索在检索中文文本资料时,经常使用的是目录索引类搜索引擎、全文搜索引擎两类信息检索方式,引类搜索引擎、全文搜索引擎两类信息检索方式,这也是因特网上常用的两类信息检索方式,具体事这也是因特网

3、上常用的两类信息检索方式,具体事例如下:例如下:类型类型举例举例目录索引类搜索引擎目录索引类搜索引擎全文搜索引擎全文搜索引擎2.元搜索引擎元搜索引擎 目录索引类搜索引擎和全文搜索引擎的检目录索引类搜索引擎和全文搜索引擎的检索范围一般在本引擎的数据库内,由于不同索范围一般在本引擎的数据库内,由于不同的搜索引擎各自的信息收集方式和范围、检的搜索引擎各自的信息收集方式和范围、检索算法和结果排序方法都索算法和结果排序方法都各不相同,因此检索结果也不尽相同。为了能够收集到更完善的信息,则需要选择恰当的搜索引擎或者把多个搜索引擎结合起来,正是为了利用多种多样的搜索引擎并节省时间,1995年元搜索引擎(Me

4、taSearch Enginc)出现了。2.元搜索引擎元搜索引擎 使用元搜索引擎,用户只需提交一次搜索请求,由元搜索引擎负责转换处理后,提交给预先选定的其他多个搜索引擎,同时检索多个数据库,并根据多个搜索引擎的检索结果进行二次加工,然后将结果输出给用户。3.特色信息检索工具特色信息检索工具 当我们查找图片、音频等信息时,使用综合信当我们查找图片、音频等信息时,使用综合信息检索引擎通常会找到很多无用的信息,所以搜索息检索引擎通常会找到很多无用的信息,所以搜索效率和有效性都不高。这时,就可以使用特色搜索效率和有效性都不高。这时,就可以使用特色搜索引擎(引擎(有时是综合信息检索工具中的一个功能有时是

5、综合信息检索工具中的一个功能有时是综合信息检索工具中的一个功能有时是综合信息检索工具中的一个功能),),特色检索工具专门搜集某一类的信息资源,内容丰特色检索工具专门搜集某一类的信息资源,内容丰富,数据量大,能帮助我们迅速找到一些有用的信富,数据量大,能帮助我们迅速找到一些有用的信息。息。3.特色信息检索工具特色信息检索工具 此外还有一些专业性质的搜索引擎,如此外还有一些专业性质的搜索引擎,如SOSIGSOSIG是专门搜集社会科学信息的信息检索工具是专门搜集社会科学信息的信息检索工具(http:/www.sosig.ac.ukhttp:/www.sosig.ac.uk),涉及经济学、哲学、教育、

6、涉及经济学、哲学、教育、政治、环境科学、心里学、人类学、社会福利、政政治、环境科学、心里学、人类学、社会福利、政府管理和妇女研究等信息资源。府管理和妇女研究等信息资源。4.其他信息检索工具其他信息检索工具 以FTP、Telnet、Usenet等资源为检索对象的检索工具。如北大天网、Archic等。5.因特网信息检索的发展趋势因特网信息检索的发展趋势 经过多年的发展之后,目前搜索引擎的功能越来越强大提供的服务也越来越全面,并呈现出如下一些发展趋势:(1).多媒体信息检索(2).专业 垂直搜索引擎 1.3.2 信息检索工具的工作原理信息检索工具的工作原理1.1.全文搜索引擎的工作原理全文搜索引擎的

7、工作原理2.2.目录索引雷搜索引擎的工作原来目录索引雷搜索引擎的工作原来 1.全文搜索引擎的工作原理 先看个例子:假设你去买笔。对老板说:“我要买支笔”老板问:“什么笔?”“圆珠笔”“什么颜色”“蓝色”老板便会从柜台中拿出一支蓝色的圆珠笔。查找信息输入描述信息的关键词在数据库中检索结果显现购物描述商品特征取货交给顾客买笔圆珠笔 蓝色柜台取货 1.全文搜索引擎的工作原理 组成部分组成部分组成部分组成部分负责工作负责工作负责工作负责工作搜索器搜索器定期自动到各网站上抓取网页定期自动到各网站上抓取网页索引器索引器分析抓取的网页,索引,存入服务器的数据库中分析抓取的网页,索引,存入服务器的数据库中 检

8、索器检索器接收用户提交的关键词,从索引数据库中提取相接收用户提交的关键词,从索引数据库中提取相关资源,向用户显现结果关资源,向用户显现结果搜索引擎的组成搜索引擎的组成全文搜索引擎的工作原理:全文搜索引擎的工作原理:搜索器 索引器 输入查询表达式 查询结果显示 查询信息排序 采集结果索引数据库检索器 索引 排序 用户查询查询结果信息采集筛选百度搜索百度搜索“海南概括海南概括”:百度蜘蛛 输入“海南概括”查询结果显示 查询信息排序 检索器 索引器 索引数据库 索引 排序 用户查询查询结果检索中国日报网 爬中国在线海南概括页面网址 抓抽取“海南、概括”等关键字 抽取关联 2.目录索引类搜索引擎的基本

9、工作原理(1 1).人工采集和存储网络信息,手工为每个网站确人工采集和存储网络信息,手工为每个网站确定一个标题,给出大概的描述,建立关键字索引,定一个标题,给出大概的描述,建立关键字索引,将其放入相应的类目体系中。将其放入相应的类目体系中。(2 2).网络目录:网络目录:按主题性质分类按主题性质分类 以某种分类体系为依据以某种分类体系为依据 形成由信息链组成的树状结构形成由信息链组成的树状结构 即总目录即总目录专题目录专题目录链接链接网站网站先分领域,后分各科专先分领域,后分各科专题题 ,最后列出网站,最后列出网站2.目录索引类搜索引擎的基本工作原理 目录索引目录索引目录索引目录索引全文索引全

10、文索引全文索引全文索引无需输入关键字,可通过浏览无需输入关键字,可通过浏览主题了解某一主题的相关资源主题了解某一主题的相关资源 需要关键字查询需要关键字查询 人工采集并存储网络信息人工采集并存储网络信息 搜索器在因特网中抓取网页,索引搜索器在因特网中抓取网页,索引器提取、组织并建立数据库器提取、组织并建立数据库 网页内容丰富、学术性较强网页内容丰富、学术性较强信息资源多、复杂,不易了解主题信息资源多、复杂,不易了解主题内容内容维护费用大、更新速度慢维护费用大、更新速度慢 搜索器定期自动搜索器定期自动“抓抓”网页网页 (3 3).特点和区别特点和区别2.因特网资源检索策略 搜索内容搜索内容搜索内容搜索内容引擎选择引擎选择引擎选择引擎选择一般信息资源一般信息资源 综合性的(百度、综合性的(百度、googlegoogle)图片、视频图片、视频 特色的,也可以用综合搜索引擎的特色的,也可以用综合搜索引擎的某个功能某个功能 专业性较强专业性较强 专业搜索引擎专业搜索引擎 全面了解网上信息资源全面了解网上信息资源 元搜索引擎元搜索引擎

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com