因特网上的信息检索幻灯片.ppt

上传人:石*** 文档编号:69431831 上传时间:2023-01-03 格式:PPT 页数:34 大小:5.72MB
返回 下载 相关 举报
因特网上的信息检索幻灯片.ppt_第1页
第1页 / 共34页
因特网上的信息检索幻灯片.ppt_第2页
第2页 / 共34页
点击查看更多>>
资源描述

《因特网上的信息检索幻灯片.ppt》由会员分享,可在线阅读,更多相关《因特网上的信息检索幻灯片.ppt(34页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、因特网上的信息检索第1页,共34页,编辑于2022年,星期五改变关键词尽量少用通配符与含糊的词使用逻辑控制符AND,利用多个条件同时满足要求进行限制使用双引号“”(英文状态下)将连在一起的词变成短语来搜索用近义词代替关键词使用逻辑控制符OR使用其他的搜索网站讨论交流:哪些搜索技巧可以缩小搜索范围?讨论交流:哪些搜索技巧可以缩小搜索范围?讨论交流:哪些搜索技巧可以缩小搜索范围?讨论交流:哪些搜索技巧可以缩小搜索范围?第2页,共34页,编辑于2022年,星期五3.2 因特网上的信息检索第3页,共34页,编辑于2022年,星期五3.2.13.2.1因特网信息检索方法因特网信息检索方法 因特网是全球性

2、的分布式系统,信息组织处于一个无因特网是全球性的分布式系统,信息组织处于一个无因特网是全球性的分布式系统,信息组织处于一个无因特网是全球性的分布式系统,信息组织处于一个无序的状态。序的状态。序的状态。序的状态。1.1.基于超文本基于超文本/超媒体的信息浏览超媒体的信息浏览2.2.2.2.基于目录服务的信息查询基于目录服务的信息查询基于目录服务的信息查询基于目录服务的信息查询3.3.基于搜索引擎的信息检索基于搜索引擎的信息检索第4页,共34页,编辑于2022年,星期五1 1、基于超文本、基于超文本/超媒体的信息浏览超媒体的信息浏览能够灵活、方便地查找信息,但信息检索很大程度上取决于所提供的链接,

3、搜索结果带有偶然性和片面性。音频资料视频资料图形图像网页网页网页第5页,共34页,编辑于2022年,星期五2 2、基于目录服务的信息查询、基于目录服务的信息查询人们根据信息的主题将网络上的资源进行分类,并以目录的形式组织和表现。一级一级二级二级三级三级四级四级第6页,共34页,编辑于2022年,星期五3 3、基于搜索引擎的信息检索、基于搜索引擎的信息检索查询请求搜索引擎:信息检索工具搜索引擎:信息检索工具查询结果:非资源本身资源的链接第7页,共34页,编辑于2022年,星期五3.2.2 3.2.2 搜索引擎的发展与分类搜索引擎的发展与分类1994年4月斯坦福大学两名博士生美籍华人杨致远和美国人

4、David Filo超级目录索引雅虎最早的搜索引擎?1 1 1 1、搜索引擎的产生、搜索引擎的产生、搜索引擎的产生、搜索引擎的产生成功地使搜索引擎的概念深入人心成功地使搜索引擎的概念深入人心从此搜索引擎进入了高速发展时期从此搜索引擎进入了高速发展时期第8页,共34页,编辑于2022年,星期五1990年起搜索引擎年起搜索引擎发展展举例例产生生时间搜索工具搜索工具开开发组或公司或公司网站特点网站特点1990ArchieMcGill Unibersity可搜索可搜索FTP文件名列表文件名列表1993GopherNevada System Computing Services University一个

5、分布式信息一个分布式信息检索系索系统1994.4Yahoo斯坦福大学斯坦福大学早期早期Yahoo数据是手工数据是手工输入入1995.12AltaVistaDEC公司公司第一个支持自然第一个支持自然语言关言关键词和高和高级检索的引擎索的引擎1997.10北大天网北大天网北大北大计算机研究室算机研究室收收录网网页约6000万万,有有强大的大的FTP搜索搜索功能功能1998.9Google斯坦福大学斯坦福大学提供网提供网页评级动态摘要、网摘要、网页快照,快照,每天更新、多文档格式支持每天更新、多文档格式支持2001.8Baidu百度公司百度公司快照、快照、预览、相关、相关词搜索、搜索、mp3、fla

6、sh搜索功能搜索功能第9页,共34页,编辑于2022年,星期五2 2 搜索引擎的分类搜索引擎的分类 目录式搜索引擎目录式搜索引擎目录式搜索引擎目录式搜索引擎 全文搜索引擎全文搜索引擎全文搜索引擎全文搜索引擎 元搜索引擎元搜索引擎元搜索引擎元搜索引擎垂直搜索引擎垂直搜索引擎 集合式搜索引擎集合式搜索引擎集合式搜索引擎集合式搜索引擎门户搜索引擎门户搜索引擎 免费链接列表免费链接列表免费链接列表免费链接列表第10页,共34页,编辑于2022年,星期五搜索引擎的分类搜索引擎的分类类型定义举例目录搜索网络信息资源按照主题分类,并以层次树状形式进行组织的一类搜索引擎.优点:实实在在找到用户所关心内容分类实

7、实在在找到用户所关心内容分类,网站导航质量高网站导航质量高缺点:分类不够细分类不够细,需要人工介入需要人工介入,目录的维护量大目录的维护量大,更新可更新可能不够及时能不够及时.第11页,共34页,编辑于2022年,星期五搜索引擎的分类搜索引擎的分类类型定义举例全文搜索使用关键词到预先建好的或租用其它索引数据库查询信息的一类搜索引擎.优点:信息量大、更新较及时、不需人工干预。信息量大、更新较及时、不需人工干预。缺点:返回信息过多,有很多无关信息。返回信息过多,有很多无关信息。第12页,共34页,编辑于2022年,星期五如果你是搜索引擎公司的老总,如果你是搜索引擎公司的老总,如果你是搜索引擎公司的

8、老总,如果你是搜索引擎公司的老总,谈谈什么是好的搜索引擎?谈谈什么是好的搜索引擎?谈谈什么是好的搜索引擎?谈谈什么是好的搜索引擎?搜索结果准确,搜索精度高 响应速度快 及时更新检索数据库,剔除“死链”思考思考第14页,共34页,编辑于2022年,星期五搜索引擎技术的发展搜索引擎技术的发展1 1 1 1、提高对用户检索提问的理解、提高对用户检索提问的理解、提高对用户检索提问的理解、提高对用户检索提问的理解2 2 2 2、对检索结果进行进一步的处理、对检索结果进行进一步的处理、对检索结果进行进一步的处理、对检索结果进行进一步的处理3 3 3 3、确定搜索引擎信息搜索范围,提、确定搜索引擎信息搜索范

9、围,提、确定搜索引擎信息搜索范围,提、确定搜索引擎信息搜索范围,提高搜索引擎的针对性高搜索引擎的针对性高搜索引擎的针对性高搜索引擎的针对性第15页,共34页,编辑于2022年,星期五搜索引擎技术的发展搜索引擎技术的发展1 1 1 1、提高对用户检索提问的理解、提高对用户检索提问的理解、提高对用户检索提问的理解、提高对用户检索提问的理解自然语言的使用使网络交流更加人性化,让查询变得更加方便、自然语言的使用使网络交流更加人性化,让查询变得更加方便、直接、有效。直接、有效。案例:了解关于杀计算机病毒的方法。案例:了解关于杀计算机病毒的方法。关键词关键词1 1:计算机病毒:计算机病毒 关键词关键词2

10、2:如何清除计算机病毒:如何清除计算机病毒第16页,共34页,编辑于2022年,星期五搜索引擎技术的发展搜索引擎技术的发展2 2 2 2、对检索结果进行进一步的处理、对检索结果进行进一步的处理、对检索结果进行进一步的处理、对检索结果进行进一步的处理基于链接评价的搜索引擎基于链接评价的搜索引擎GoogleGoogle设计者认为:设计者认为:一个网页的重要性取决于他被其他网页链接的数量一个网页的重要性取决于他被其他网页链接的数量基于访问大众性的搜索引擎基于访问大众性的搜索引擎这类搜索引擎的设计者认为这类搜索引擎的设计者认为大多数人选择访问的网站就是最重要的网站大多数人选择访问的网站就是最重要的网站

11、。去掉检索结果中附加的多余信息去掉检索结果中附加的多余信息第17页,共34页,编辑于2022年,星期五搜索引擎技术的发展搜索引擎技术的发展3 3 3 3、确定搜索引擎信息搜索范围,提高搜索引擎的针对性、确定搜索引擎信息搜索范围,提高搜索引擎的针对性、确定搜索引擎信息搜索范围,提高搜索引擎的针对性、确定搜索引擎信息搜索范围,提高搜索引擎的针对性1 1 1 1、垂直主、垂直主、垂直主、垂直主题题搜索引擎:高度的目搜索引擎:高度的目搜索引擎:高度的目搜索引擎:高度的目标标化和化和化和化和专业专业化化化化第18页,共34页,编辑于2022年,星期五搜索引擎技术的发展搜索引擎技术的发展3 3、确定搜索引

12、擎信息搜索范围,提高搜索引擎的针对性、确定搜索引擎信息搜索范围,提高搜索引擎的针对性1 1 1 1、垂直主、垂直主、垂直主、垂直主题题搜索引擎:高度的目搜索引擎:高度的目搜索引擎:高度的目搜索引擎:高度的目标标化和化和化和化和专业专业化化化化2 2 2 2、非、非、非、非WWWWWWWWWWWW信息搜索:提供信息搜索:提供信息搜索:提供信息搜索:提供FTPFTPFTPFTP类类信息的信息的信息的信息的检检索索索索第19页,共34页,编辑于2022年,星期五搜索引擎技术的发展搜索引擎技术的发展3 3 3 3、确定搜索引擎信息搜索范围,提高搜索引擎的针对性、确定搜索引擎信息搜索范围,提高搜索引擎的

13、针对性1 1 1 1、垂直主、垂直主、垂直主、垂直主题题搜索引擎:高度的目搜索引擎:高度的目搜索引擎:高度的目搜索引擎:高度的目标标化和化和化和化和专业专业化化化化2 2 2 2、非、非、非、非WWWWWWWWWWWW信息搜索:提供信息搜索:提供信息搜索:提供信息搜索:提供FTPFTPFTPFTP类类信息的信息的信息的信息的检检索索索索3 3 3 3、多媒体搜索引擎:、多媒体搜索引擎:、多媒体搜索引擎:、多媒体搜索引擎:实现实现多媒体多媒体多媒体多媒体检检索索索索第20页,共34页,编辑于2022年,星期五搜索引擎技术的发展搜索引擎技术的发展1 1 1 1、提高对用户检索提问的理解、提高对用户

14、检索提问的理解、提高对用户检索提问的理解、提高对用户检索提问的理解2 2 2 2、对检索结果进行进一步的处理、对检索结果进行进一步的处理、对检索结果进行进一步的处理、对检索结果进行进一步的处理3 3 3 3、确定搜索引擎信息搜索范围,提、确定搜索引擎信息搜索范围,提高搜索引擎的针对性高搜索引擎的针对性第21页,共34页,编辑于2022年,星期五3.2.3 3.2.3 搜索引擎的工作过程搜索引擎的工作过程信息检索信息检索信息检索信息检索人工智能人工智能人工智能人工智能计算机网络计算机网络计算机网络计算机网络分布式处理分布式处理数据库数据库数据库数据库数据挖掘数据挖掘数据挖掘数据挖掘数字图书馆数字

15、图书馆数字图书馆数字图书馆自然语言处理自然语言处理 搜索引擎是一个交叉的研究领域,搜索引擎是一个交叉的研究领域,极具综合性和挑战性。极具综合性和挑战性。第22页,共34页,编辑于2022年,星期五目录式搜索引擎的工作过程目录式搜索引擎的工作过程以人工方式或半自动方式搜集信息,由编辑员查看信息后,人工形成信息摘要,并将信息置于事先确定的分类框架中。用户通过浏览分类目录来查看自己所需要的信息,再链接到信息资源所在的位置。目录页面Sodig分类“国家地区”“四川”“成都”“川师附中”第23页,共34页,编辑于2022年,星期五全文搜索引擎的工作过程全文搜索引擎的工作过程搜索器搜索器互联网初识数据索引

16、器索引器检索器索器索引数据库接口界面IE浏览器用户搜索输出查询信息系统定期搜索网络提取并组织、排序关键字对比、提取第24页,共34页,编辑于2022年,星期五SpiderSpider系统程序:像蜘蛛一系统程序:像蜘蛛一样在网络间爬来爬去,追踪样在网络间爬来爬去,追踪互联网,捕获网址。互联网,捕获网址。第25页,共34页,编辑于2022年,星期五第26页,共34页,编辑于2022年,星期五用户接口用户接口第27页,共34页,编辑于2022年,星期五课堂小结课堂小结一、信息检索的方法一、信息检索的方法1.1.1.1.基于超文本基于超文本基于超文本基于超文本/超媒体的信息浏览超媒体的信息浏览超媒体的

17、信息浏览超媒体的信息浏览2.2.2.2.基于目录服务的信息查询基于目录服务的信息查询基于目录服务的信息查询基于目录服务的信息查询3.3.3.3.基于搜索引擎的信息检索基于搜索引擎的信息检索基于搜索引擎的信息检索基于搜索引擎的信息检索二、主要二类搜索引擎二、主要二类搜索引擎二、主要二类搜索引擎二、主要二类搜索引擎1 1、目录式搜索引擎、目录式搜索引擎2 2、全文搜索引擎、全文搜索引擎第28页,共34页,编辑于2022年,星期五一、选择题一、选择题1.以下选项中,不属于因特网中信息检索的主要方法是()A基于超文本/超媒体的信息浏览B基于搜索引擎的信息检索C基于“我的电脑”文件搜索D基于目录服务的信

18、息查询答案:C2(多选题)以下选项中,属于网络主要搜索引擎的分类是()A全文搜索B目录搜索C专业搜索D元搜索答案:AB第29页,共34页,编辑于2022年,星期五一、选择题一、选择题3我们通过网页中的链接去访问另外一个信息资源的信息检索方法是()。A基于超文本/超媒体的信息浏览 B基于目录服务的信息查询C基于搜索引擎的信息检索 D特种搜索引擎答案:A4使用全文搜索引擎,搜索的结果是()。A我们所要找的全部信息 B互联网上客观存在的网页数据C搜索引擎数据库中的数据 D以上都不是答案:C第30页,共34页,编辑于2022年,星期五一、选择题一、选择题5全文搜索引擎一般采用什么原理来采集信息()。A

19、人工方式 B“蜘蛛”程序 C关键字检索 D检索工具答案:B6如果要搜索桂林旅游景点,则应该在搜索框输入什么关键字才能高效地找到有用信息()。A桂林or旅游景点 B桂林or旅游or景点C桂林or旅游and景点 D桂林and旅游and景点答案:D第31页,共34页,编辑于2022年,星期五二、判断题二、判断题7由于因特网是全球性的分布式系统,数以百万计的信息提供都难以按照一定的约定来提供信息,因此,整个因特网的信息组织处于一个无序状态。()答案:对8搜索引擎是因特网上信息检索的软件系统,最早的搜索引擎出现于1994年4月,是由斯坦福大学的两名博士(其中包含美籍华人杨致远)创办的雅虎。()答案:对9

20、目录式搜索引擎是以人工方式收集信息,由编辑人员查看信息后并将信息分类置于事先确定的相应目录中。()答案:对第32页,共34页,编辑于2022年,星期五二、判断题二、判断题10目录式搜索引擎是通过计算机进行分类和整理,不需要人工干预。()答案:错分类不够细,需要人工介入,目录的维护量大,更新可能不够及时.11全文搜索引擎的优点是信息量大、更新较及时、不需人工干预;缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。()答案:对第33页,共34页,编辑于2022年,星期五实践活动实践活动1 1 1 1、应用搜索引擎中的图片搜索功能,查找并整理历届奥、应用搜索引擎中的图片搜索功能,查找并整

21、理历届奥、应用搜索引擎中的图片搜索功能,查找并整理历届奥、应用搜索引擎中的图片搜索功能,查找并整理历届奥运会会徽图片,看谁搜索得又快又全,将图片粘贴在运会会徽图片,看谁搜索得又快又全,将图片粘贴在运会会徽图片,看谁搜索得又快又全,将图片粘贴在运会会徽图片,看谁搜索得又快又全,将图片粘贴在学案相应位置。学案相应位置。学案相应位置。学案相应位置。2 2 2 2、尝试在百度或、尝试在百度或、尝试在百度或、尝试在百度或googlegoogle搜索引擎查询中加入以下的过搜索引擎查询中加入以下的过搜索引擎查询中加入以下的过搜索引擎查询中加入以下的过滤词滤词滤词滤词 ,看看效果如何,思考可以用这种方法解决些,看看效果如何,思考可以用这种方法解决些,看看效果如何,思考可以用这种方法解决些,看看效果如何,思考可以用这种方法解决些什么问题?什么问题?什么问题?什么问题?过滤词:过滤词:过滤词:过滤词:Site:Site:Site:Site:例:例:例:例:site: site: site: site: 环境保护环境保护环境保护环境保护第34页,共34页,编辑于2022年,星期五

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com