网络信息检索与利用精品文稿.ppt

上传人:石*** 文档编号:71973920 上传时间:2023-02-07 格式:PPT 页数:57 大小:6.17MB
返回 下载 相关 举报
网络信息检索与利用精品文稿.ppt_第1页
第1页 / 共57页
网络信息检索与利用精品文稿.ppt_第2页
第2页 / 共57页
点击查看更多>>
资源描述

《网络信息检索与利用精品文稿.ppt》由会员分享,可在线阅读,更多相关《网络信息检索与利用精品文稿.ppt(57页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、网络信息检索与利用第1页,本讲稿共57页2/7/202316.1意义、目的、定义通过网络广泛、及时地了解外面的世界。对大学的用户来说,更重要的是及时了解有哪些网上学术资源能有利于教学、科研和学习。学习的目的是熟练掌握网上查找、利用所需文献信息的技能。定义有广义和狭义之分第2页,本讲稿共57页2/7/202326.2网上信息资源的构成p115由连接在网上的计算机中的计算机中的信息信息、网上的信息工具信息工具以及网络通信渠道网络通信渠道三方面构成。第3页,本讲稿共57页2/7/20233接上页*计算机中的数据库、电子出版物、主页信息、软件以及各种格式的文件;*信息工具包括FTP、Telnet、Em

2、ail、Gopher、Archie、WAIS、WWW浏览器、搜索引擎等提供信息交流、浏览、查询、保存、组织功能的各种工具。*网络通信渠道是指网络提供的信息交流的渠道。第4页,本讲稿共57页2/7/202346.2网上信息资源的特点p116(1)数量庞大、增长迅速(2)更新频繁、变化无常(3)多维显示、交互方便(4)良莠混杂、参差不一第5页,本讲稿共57页2/7/202356.2网络学术资源的类型按照内容区分,主要有四类.按照出版类型区分,有着与纸质型出版物类似的对应关系.按照是否具有原创性,有一次资源和二次资源的区分.第6页,本讲稿共57页2/7/20236接上页按照有否经过审核,分为正式出版

3、物和非正式出版物两种.按照是否属于搜索引擎检索范围,分为可见资源和不可见资源两类。第7页,本讲稿共57页2/7/202376.3网上信息服务功能1、基本信息服务:、基本信息服务:E-mail电子邮件FTP(FileTransferProtocol)文件传输TELNET远程登录以及基于电子邮件的一系列扩展服务,如电子公告板(BBS)、网络新闻(Usenet)等;2、网上信息查询服务、网上信息查询服务包括名录服务、索引服务和交互式信息查询服务等。第8页,本讲稿共57页2/7/202386.4网络信息利用工具的几个概念p1171、WWW浏览器是用来浏览信息的客户程序(worldwideweb全球信息

4、网)2、URL(UniformResourceLocator 统一资源定 位器)提供了一种地址寻找方式p117。3、超文本标识语言(HTML)第9页,本讲稿共57页2/7/202394 网站网站:是互联网的基本信息单元。网站的划分网站的划分:按照服务性质区分为两类:门户网站综合性(信息面广)垂直网站专业性5 网页网页:是浏览网站内容的主要形式。第10页,本讲稿共57页2/7/202310URL 的的 构构 成成URL的构成:p117通信协议通信协议:/主机主机 名名/路径路径/文件名文件名如:http:/ ftp telnet第11页,本讲稿共57页2/7/202311URL协议http:/超

5、文本传输协议ftp:/文件传输协议Gopher:/gopher服务器协议wais:/WAIS服务器协议telnet:/远程登录协议mail:/E-mail协议第12页,本讲稿共57页2/7/202312URL 主主 机机 地地 址址域名含义域名含义.acacademic学院.milMilitary军用.coCommercial商业英式.netNetwork网.comCommercial商业美式.orgNonprofit机构Organization.edueducational教育.plcPubliclimited公司Company.govgovernmental政府.schSchool学校第1

6、3页,本讲稿共57页2/7/202313URL国家地区域名域名 含义域名 含义.auAustralia.intinternational.caCanada.itIChina.jpJapan.deGerman.ruRussia.esSpain.ukUnitedKingdom第14页,本讲稿共57页2/7/2023146.5 搜索引擎搜索引擎(search engines)p119是网上信息搜索工具的通称。它可以是一个独立的门户网站,也可以是附在其他类型网站或主页上的一个搜索工具。各种搜索引擎工作过程一般包括以下三个方面:用自动搜索软件搜寻集中所有信息 将信息进行分类整理,建立搜索引擎数据库通过w

7、eb服务器端检索软件,提供信息查询的浏览器界面第15页,本讲稿共57页2/7/2023156.5.1搜索引擎的类型p119按工作方式区分:可分为:主题引擎目录引擎多元引擎第16页,本讲稿共57页2/7/202316主主 题题 引引 擎擎主题引擎又称基于Robot的搜索引擎。这种引擎的信息主要为网页.其特点是利用一个称为Robot(也叫做Spider、WebCrawler或WebWanderer)的程序自动访问Web站点,提取站点上的网页,并根据网页中的链接进一步提取其它网页,或转移到其它站点上。第17页,本讲稿共57页2/7/202317主题引擎由三个主要部分构成:Robot、Index和搜索

8、软件。主题引擎的优缺点:优点:信息量大、更新及时、无需人工干预缺点:返回信息过多,有很多无关信息,甚至有一定比例的死链接,用户必须从结果中进行筛选。第18页,本讲稿共57页2/7/202318主题引擎的代表主题引擎的代表:国外:国外:Google(http:/)Lycos(http:/)Excite(http:/)Inktomi(http:/)等国内国内:百度(http:/)OpenFind(http:/)等第19页,本讲稿共57页2/7/202319注:注:主题搜索引擎也提供分类查找途径,主题搜索引擎也提供分类查找途径,但其分类为自动分类,或是借用其但其分类为自动分类,或是借用其他目录引擎的

9、分类数据他目录引擎的分类数据(例如例如Google利用网景公司的利用网景公司的Open Directory分类分类),因而分类检索效,因而分类检索效果不如目录指南型搜索引擎。果不如目录指南型搜索引擎。第20页,本讲稿共57页2/7/202320目目 录录 引引 擎擎目录引擎又称目录指南型搜索引擎.信息大多面向网站.目录引擎的用户界面基本上都是分级结构.用户也可以利用目录引擎提供的搜索功能直接查找一个关键词,不过,由于目录引擎只在数据库保存的编辑对站点的描述中进行搜索,因此站点本身的动态变化不会反映到搜索结果中来,这也是目录引擎与主题引擎之间的一个主要区别。不少学术或研究性质的目录引擎是依靠志愿

10、者来建立和维护的。也带来了目录引擎分类质量参次不齐的问题。第21页,本讲稿共57页2/7/202321目录引擎的代表目录引擎的代表国外:Yahoo!(http:/)雅虎中国http:/ 纳纳主题引擎和目录引擎两者最主要区别:在于有无信息的人工处理过程。目录引擎的信息因为有人工处理过程,所以死链接较少、信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。而主题引擎的信息的收集和处理完全由程序软件自动进行,信息的特点正好和分类引擎相反,信息量大,更新速度略快,但死链接比例相对略高。因而主题引擎适用于专指度较高、内容要求比较新的课题。目录引擎适用于学科调研的场合。第23页,

11、本讲稿共57页2/7/202323多元搜索引擎多元搜索引擎又称元搜索引擎.多元引擎的服务方式为面向网页的全文检索.它本身没有存放网页信息的数据库。当用户查询一个关键词时,它把查询请求转换成其它数个搜索引擎能够接受的命令格式,并行地或者有选择性地访问这些搜索引擎并查询这个关键词,然后再返回给用户。第24页,本讲稿共57页2/7/202324严格意义上来讲,多元搜索引擎只能算是一种用户代理,而不是真正的搜索引擎。多数多元搜索引擎都只能访问少数几个搜索引擎,而且不支持这些搜索引擎的高级搜索功能,在处理逻辑查询时也常常会出现错误,这些是多元搜索引擎的缺点。第25页,本讲稿共57页2/7/202325多

12、元搜索引擎的代表国外:C4(http:/)Dogpile(http:/)Profusion(http:/)InfoMarket(http:/)等国内:万纬(http:/)等第26页,本讲稿共57页2/7/2023266.5.1搜索引擎的类型按检索语言区分:按分类(目录分类)建立索引:(人工)雅虎分类按关键词建立索引:(自动)Google第27页,本讲稿共57页2/7/202327按工作语种区分:可分为中西文(国内、国外)二种搜索引擎;按检索内容区分:以提供信息服务为主,具有门户网站性质的搜索引擎;专门以检索人名为目的的搜索引擎;第28页,本讲稿共57页2/7/2023286.5.2搜索引擎的使

13、用方法p122不同的搜索引擎有不同的检索界面,常用的有:一般检索和高级检索二种。不同的搜索引擎有不同的检索技术,构成的检索策略不尽相同。一般有布尔逻辑检索、词组检索、字母大小写检索、字段检索、截词等检索(具体请参见各搜索引擎的帮助说明)。第29页,本讲稿共57页2/7/202329字段检索举例字段检索举例第30页,本讲稿共57页2/7/202330字段检索举例字段检索举例第31页,本讲稿共57页2/7/202331字段检索举例字段检索举例第32页,本讲稿共57页2/7/2023326.5.3 百度搜索引擎百度搜索引擎(见帮助见帮助)http:/p122功能功能网页功能(默认);新闻MP3;图片

14、网站;贴吧第33页,本讲稿共57页2/7/2023336.5.3百度搜索引擎百度搜索引擎(见帮助见帮助)检索词可以输入除开标点符号以外的任何中文、英文、数字或中文英文数字的混合体;百度不区分英文字母大小写;百度只有英语词组检索功能,将英语词组放在双引号中进行检索即行,而无中文词组检索功能;百度没有模糊检索(检索词要求一字不差);也没有截词检索功能;第34页,本讲稿共57页2/7/2023346.5.3百度搜索引擎百度搜索引擎(见帮助见帮助)三种逻辑运算符:1逻辑与:空格(AB)2逻辑或:|(A|A)前后有空格3逻辑非:-(A-B)前有空格后无第35页,本讲稿共57页2/7/2023356.5.

15、3百度搜索引擎百度搜索引擎(见课件见课件)字段检索(1)在指定网站内搜索格式:检索词、空格、site:网址(2)在标题中搜索格式:intitle:检索词(3)在网址中搜索格式:inurl:检索词百度的特色功能第36页,本讲稿共57页2/7/2023366.5.4百度搜索引擎检索策略百度搜索引擎检索策略一课题“互联网资源”混合使用逻辑与和词组算符的策略有以下两种:(1)“internetresource”OR“webresource”(2)(internetORweb)resource注:这两种策略及其检索结果的区别是:前一种策略在词组运算的基础上做逻辑或,概念相对确切,因而查准率较高。后一种策

16、略先做逻辑或,再应用逻辑与,概念相对模糊,因而查全率要好于前一种策略。第37页,本讲稿共57页2/7/202337接上页:混合使用逻辑与和标题字段算符的检索策略有以下两种:(1)intitle:internetintitle:resource(2)intitle:internetresource注:这两种策略的相同点是都将检索词限制在标题和说明语中,不同点是前一种策略将两个检索词分别使用字段限制,然后使用逻辑与,检索范围相对较窄,因而所得结果数量较少。后一种策略将两个检索词合并使用一个字段算符,检索范围相对较宽,因而所得结果数量较多。第38页,本讲稿共57页2/7/2023386.5.4百度搜

17、索引擎检索策略百度搜索引擎检索策略二课题:“在教育机构网站中查找含互联网资源内容的网页”混合使用词组、逻辑与和网址字段算符的检索策略:“internetresource”inurl:edu注:这个策略以词组算符检索“互联网资源”,合并使用网址字段算符,基本上可以达到课题目的。但实际得到的检索结果要超出教育机构的范围,因为“inurl:edu”的确切含义是网址中含有“edu”字符的所有网页,当“edu”不在域名位置时,网页就并不一定属于教育机构。第39页,本讲稿共57页2/7/2023396.5.5搜索引擎检索实习搜索引擎检索实习具体实习内容、要求具体实习内容、要求(具体文章不要具体文章不要)、

18、方式等请见课件、讲稿;、方式等请见课件、讲稿;查找操作过程可参见查找操作过程可参见baidu帮助示帮助示例、讲稿的例、讲稿的baidu搜索引擎检索实搜索引擎检索实例;例;上网演示上网演示第40页,本讲稿共57页2/7/2023406.6国内外网络数据库书目数据库书目数据库:查询各种文献资料目录的数据库如因特网公共联机图书目录数据库:InternetPublicAccessedCatalog简称iPAC摘要数据库:文献数据量大,文献类型齐全,语种多,数据及主题词规范性好、索引系统完备。全文数据库:全文数据库是一种存储文献全文或其主要部分并能提供全文检索的源数据库,与书目数据库、事实数据库相比较,

19、主要特点是包含原始信息、信息检索彻底、所用检索语言比较自然、数据结构为非结构化数据第41页,本讲稿共57页2/7/202341国内网络摘要数据库中国科学院文献情报中心:http:/中国科学引文数据库、中国科学文献数据库等CALIS系统数据库:http:/高等学位论文库、学术会议论文库、中文现刊目次库、各类专业特色数据库等。第42页,本讲稿共57页2/7/202342国内外网络全文数据库举例学校图书馆主页国内:中国期刊网;维普中文期刊数据库;等.国外(工科为主):Elsevier Science;Kluwer Online;国外(文科为主):Ebsco Host第43页,本讲稿共57页2/7/2

20、023436.7 虚虚 拟拟 图图 书书 馆馆(专业性)p129是互联网信息检索利用工具;是用以查找特定领域各类网络信息的网站。http:/vlib.org与搜索引擎有一定区别。第44页,本讲稿共57页2/7/202344虚拟图书馆与搜索引擎的区别虚拟图书馆与搜索引擎的区别虚拟虚拟搜索搜索结构区分无数据库支持有数据库支持使用方法只有网页浏览有检索查找过程无检索过程收集方式人工组织程序自动,有死链接。质与量质高,专业性强,综合信息,面广,量大如专业学会,协会 非专业信息源。站点,有网络导航作用第45页,本讲稿共57页2/7/2023456.8网上免费全文学术资源不能一概而论地说可以通过网络或者通

21、过印刷型文献,不同类型的文献获取渠道应该不同。例如,属于核心学术期刊或者会议录上的原文,图书馆情报所有普遍收藏,那么应该干脆放弃从网上查找,转而查找印刷型的期刊或会议录,因为它们不大可能属于免费网络资源之列。除此之外的文献类型,包括非核心类的期刊(特别是动态性的期刊)、专利和报告以及未经审查的各种非正式出版物(或称灰色文献),都可能属于网上免费提供的全文资源。由此可见,在需要获取原文时,首先要区分所需的文献属于什么类型。第46页,本讲稿共57页2/7/2023466.8.1学术网站的定义和类型以学科领域的专业研究人员为主要对象,以学术研究内容为主要内容,以满足学术信息交流为主要目的的网站称为学

22、术网站。学术网站包括学科门户网站、学科资源网站、学术机构网站、行业协会机构网站、学科专家网站以及学科论坛网站等。非学术网站则是除学术网站之外的所有网站,包括商业网站、公司网站、娱乐网站等。第47页,本讲稿共57页2/7/202347接上页:(1)学科门户网站。集研究机构、研究课题、专著论文、会议消息等内容之大成,主要宗旨为提供信息交流平台。这类网站中,尤其以国际学科门户网站为优。它们内容更新及时,能反映当前最新学术动态,是跟踪学科发展的重要途径。例如,中国经济学教育科研网(http:/ OR sensors)(inurl:paper ORinurl:articleORinurl:pdfORin

23、url:text)搜索引擎法查找网上灰色文献,特点是获得的文献数量较大,但因为是非正式文献,内容可能不太可靠,而且灰色文献的变化快,而搜索引擎的数据库常常不能及时更新,造成所得结果的死链接比例很大,也使得筛选十分地费时费力。第53页,本讲稿共57页2/7/2023536.8.3通过全文网站获取文献全文加拿大Waterloo大学主办的学术学会网站http:/www.scholarly-societies.org/full-text_soc.html)它把世界上各个学会主办的期刊统统收集起来,做在一个网页上,因而极大地方便了使用。这个网站提供的期刊多数属于印刷、网络双栖型期刊,内容相当可靠。使用时

24、,先按照分类选择学会,进而选择期刊。期刊后面的说明语中凡没有注明“subscriptionrequired”,就属于免费期刊,点击期刊链接,即可阅读全文。第54页,本讲稿共57页2/7/202354接上页:FindArticles(http:/)可免费查找网上300余种期刊杂志文献全文的数据库,时间跨度为从1998年起到目前为止。这些期刊的主要涉及的学科领域是商业、健康、社会、娱乐、体育、计算机和网络等方面。TheNASAAstrophysicsDataSystem(http:/adswww.harvard.edu/)世界最大免费全文网站,超过300,000篇全文主要学科:天体物理学第55页,

25、本讲稿共57页2/7/202355接上页:HighWirePresshttp:/intl.highwire.org/世界第二大免费全文网站,超过235,812篇全文主要学科:生物学、医学.arXiv.org(http:/arxiv.org/)主要学科:物理、数学、非线性科学、计算机科学等。文件格式有文摘、PostScript、PDF等文件格式。等第56页,本讲稿共57页2/7/202356超星数字图书馆使用(免费)上大主页超星数字图书馆下载浏览器安装浏览器双击浏览器图标左上角资源 数字图书馆 免费图书馆选择所需类目(专业)如:工商经济第三产业书目列表选择房地产开发一书(末尾第三条书目)点击阅读按钮可浏览文献全文。第57页,本讲稿共57页2/7/202357

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com