检索表达式构建.doc

上传人:豆**** 文档编号:17641247 上传时间:2022-05-25 格式:DOC 页数:22 大小:215.50KB
返回 下载 相关 举报
检索表达式构建.doc_第1页
第1页 / 共22页
检索表达式构建.doc_第2页
第2页 / 共22页
点击查看更多>>
资源描述

《检索表达式构建.doc》由会员分享,可在线阅读,更多相关《检索表达式构建.doc(22页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流检索表达式构建.精品文档.【资料】检索表达式(提问式)的构造注:本来这次实习报告是要测试同学们目前的文献检索水平的,相当于做一次调查,再分析存在的问题,有针对性进行教学,提高同学们的检索技能。但有同学提出一些问题后,老师觉得有必要这个资料个你们,希望对你们提高检索能力有帮助。如对其中的一些问题不理解,也不要焦急,我们这部分没学得,下个专题就要学到了。顺便发下一专题学习的教案给你们,可以提前了解。检索表达式 也称检索式或检索提问式,是检索策略的具体表现,是用逻辑运算符将检索词组配而成,它就直接影响检索结果。检索式是检索策略的具体表述,是通过逻辑

2、算符、位置算符、截词算符等把表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容,又能被机器识别和执行,是决定检索策略质量和检索效果的重要因素。检索提问式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其它组配连接符号组成。检索表达式的制定要遵循以下几个步骤:(1) 切分 是对课题包含的词进行最小的分割(2) 删除 对过分宽泛或过分具体的词、无实际意义的边词、虚词应予以删除。如“的” “及” (3) 替换 对表达不清晰活容易造成检索误差的词加以替换。 如 “绿色包装” 中的绿色应替换成“环保” (4) 补充或增加 这一步是

3、将课题筛选出的词进行同义词、近义词、相关词的扩充,这些词加入检索款目可以避免漏检。(5) 组合 把检索词用逻辑符号链接组合成检索式。聚类组合法:切分、删除、替换、补充、增加、组合。例1:壮族传统民居的研究切分:壮族 传统 民居 的 研究壮族 传统 民居 建筑 的 研究 补充 (删除)壮族 传统 民居 建筑 例2:大气中细菌浓度的计算方法(替换)大气污染的计算方法例3:高层建筑的优化设计(切分)高层建筑的优化设计(删除)高层建筑优化设计(替换)高层建筑优化结构设计(词的集合)(聚类)高层优化结构设计(组面的集合)建筑例4:(补充)煤田勘探煤田勘探煤田地质勘探(增加限义词)勘探勘探煤田(逻辑“与”

4、)勘探勘探煤田(逻辑“非”)例5:(组合)a,b,c a,b,c ab,ac,bc,ba,ca,cb abc,acb,bac,bca,cab,cba生物心理学 生物*心理*科学 生物学*心理心理学*生物 生物心理学心理生物学例6壮民族旅游文化资源的开发与综合利用例7绿色设计在我国的发展及状况_ _ The Green Designs develop and condition in our country课题重点、关键词、主题词等分析(中英文):绿色设计(green design)、我国(our country) 、发展(develop)、状况(condition)检索式(例):1. 绿色设计

5、and我国and发展or状况2 绿色设计and中国and发展or状况3 中国and绿色设计and发展or状况4, 中国and绿色设计and发展or状况例8“有关造纸废水的处理技术”方面的检索式,首先抽起检索词:造纸paper making, paper pulp废水waster water 处理treat, treatment构造检索式:(paper w making or paper w pulp) and waster water and (treat or treatment)。例9父母民主型教养方式对幼儿卫生行为习惯培养的影响【】苏东坡历史故事苏东坡 历史故事 中国 现代【】网页设计与

6、网站建设的思考与设计网页设计 网页制作 网站设计 网站建设【】投机家的证劵心理分析股票 证劵投资 市场心理学【】信息时代的企业人力资源管理例9 检索实习报告范例三 利用计算机网络数据库检索。我院有多种计算机网络数据库,本范例中只给出清华同方全文数据库和维普全文数据库检索样例。其他中文数据库可以参照实习。计算机数据库检索是利用字段检索实现信息检索,所以准确使用所需检索的字段是检索的关键。同时计算机数据库检索都有普通检索与高级检索之分,本课程检索实习要求使用高级检索(即布尔逻辑检索)或二次检索。班级 学号 姓名 日期 题目:探讨港口物流中心的运作模式对现代物流的影响1.课题分析:以港口为中心,大力

7、发展现代物流业已成为一种必然趋势。而港口发展现代物流业最重要的是建立现代化的港口物流中心。在我国,目前各大港口都已经朝着物流中心转化,上海,广州,天津,深圳,厦门等港口都在积极规划建设物流园或物流中心。我国港口物流中心发展不成熟,且物流中心的建设需要巨大的投入。因此,对我国港口发展物流中心的运作模式进行理论上的探讨,对指导港口物流中心的建设是有着现实意义的。即物流问题涉及港口建设与经营、管理。其次,物流学科是个跨学科的研究对象,除了涉及港口外还涉及对外贸易、铁路与公路的运输,物资的供应链与流通。但此课题不涉及一般物流概念,诸如:生产企业的物流、超市物流等。根据这些分析,我们可以看出课题涉及的主

8、题(关键词)主要是港口、物流、物流中心、供应链等。因此,应该对这些关键词进行全面的布尔逻辑检索。另外,物流概念是近几年提出,为了检索到较新的信息,检索时限定检索时限为2001年至今。2.选择数据库: 清华同方全文数据库和维普全文数据库3.检索途径:根据以上分析选用主题词检索字段检索,且用港口与物流两词进行布尔逻辑检索。即采用高级检索,也可以采用简单检索后进行二次检索方法,以达到同样效果。高级检索:关键词:港口*物流一般检索:关键词:港口;在第一次检索后使用二次检索,关键词为:物流(二次检索相当与布尔逻辑检索中的与检索)4.检索内容:(1)清华同方【篇名】 当代国际航运中心发展的新趋势兼析上海国

9、际航运中心的规划建设 CAJ原文下载 【关键词】 国际航运中心;集装箱转运;港口区域组合;物流中心;上海市 【篇名】 天津港集装箱物流中心战略构想 CAJ原文下载 【关键词】 天津港;集装箱物流中心;战略规划;目标模式;建设构架;功能设计;对策建议 (2)维普 第一条【题名】 全球物流发展趋势与港口功能转变深圳案例经验分析 【关键词】 深圳市 案例 港口发展 全球物流 发展趋势 港口功能 第二条【题名】 港口物流信息系统评价原则及方法 【关键词】 港口 物流信息系统 诊断 评价 检索内容已有格式说明,故不进行格式说明。(以上内容直接从计算机上检索并下载)例10 检索实习报告范例四课题: 计算机

10、辅助设计在建筑设计中的应用1.课题分析:当前世界各国在建筑设计广泛采用先进技术,以增强建筑设计上的竞争能力和提高建筑的技术含量。过去在建筑的设计上主要靠人工完成,随着计算机技术的开发,特别是计算机辅助设计技术的产生和应用,使建筑设计有了很大的技术保障,但我国计算机辅助设计在建筑设计中的应用相对落后。对此,检索有关信息,以利用有关国家在这方面的情报。根据分析,确定的主题词为建筑设计 , 计算机辅助设计。2、检索途径: 在Ei数据库中有两个可以检索的库,本次检索使用20002003的数据库。同时依据以上分析,采用建筑设计, 计算机辅助设计这两个词的“与”检索。“计建筑设计*计算机辅助设计”其检索式

11、(检索表达式或叫检索提问式)是:“计建筑设计*计算机辅助设计”3.检索内容:例10 (二)实习(实验)二 检索工具与参考工具使用方法全国报刊索引使用方法(其他检索工具与参考工具使用方法一样)全国报刊索引目前有2种检索途径,分别是分类途径和著者途径。下面举例说明其使用方法。1分类途径检索工具 全国报刊索引(自然科学技术版)检索课题 GPS车辆定位系统研究(1995-200年)检索程序 第一步:分析研究课题,选择查找分册。根据课题含意,应选全国报刊索引(自然科学技术版)。第二步:确定类目。对照全国报刊索引(自然科学技术版)类目表,确定该课题的类目为“P22 大地测量学”。第三步:根据确定的类目名称

12、逐本查找,直到满足检索要求为止(1995-200年)。例如在2003年 11期上查得:031101554 GPS车辆定位监控系统的应用/李星蓉(华北电力大学,071003)/电力系统通信(南京).-2003,24(6).-34-37第四步:索取原始文献:(1)用上步获得的期刊刊名电力系统通信查中文期刊馆藏目录,获得馆藏单位;(2)去人或去函借阅或复制。.著者途径检索工具 全国报刊索引(哲学社会科学版)检索课题查找经济学家吴晓求2003年发表的论文检索程序 第一步:分析研究课题,选择查找分册。经济学家吴晓求发表的论文一般属于经济学范畴,因此应选择全国报刊索引(哲学社会科学版)。第二步:用著者姓名

13、按姓氏汉语拼音字顺在每期全国报刊索引(哲学社会科学版)后面的“著者索引”中查找,获得文献顺序号。例如在2003年6期和9期上分别查得:吴晓求 030609834 (6期)吴晓求 030907098 (9期)第三步:用所获文献顺序号(俗称文摘号)查同期题录本,获得文献篇名与文献出处等。第6期上为:030609834 资本结构和公司治理/吴晓求(中国人民大学金融与证券研究所)/资本市场.-2003,(4).-23-28第9期为:030907098 激励机制与资本结构:理论与中国实证/吴晓求(中国人民大学金融与证券研究所)/管理世界.-2003,(6).-5-14第四步:索取原始文献:步骤同分类途径

14、,第四讲 文献检索原理、方法和技术 一、文献检索原理检索含义:从信息集合中迅速、准确地查找出所需信息的过程和方法。1、定 义 文献信息检索是人们利用特定的检索技巧与方法,从信息集合中对目标资源进行快速定位,获取与信息需求相关的那部分信息的过程。 从文献信息处理的角度来说:文献信息检索包括信息存储与检索两个过程; 从读者检索的角度来说:文献信息检索仅指从信息集合中找出信息的过程,相当于人们通常所说的信息查询。信息集合是指有组织的信息资源整体,可以是:馆藏目录、数据库、(印本)检索工具等。文献信息存储过程:将大量分散的文献信息搜集起来,根据其内容特征或外表特征进行标引,形成表征这些文献信息的特征标

15、识,并存储在一定的载体上,成为有查询功能的检索工具。 标引:对文献内容特征和外部特征进行分析形成概念标识,再依据一定的标准或规则(检索语言:如分类号、主题词、关键词及著者选用规则等)将其用相应的标识充分、准确地表达出来。文献信息检索过程:用户根据自己的信息需求,提出检索提问,然后使用有关的标引语言(也称检索语言)将拟定的检索提问规范成检索标识,用于检索的过程。二、文献检索方法 在浩如烟海的文献中要查阅到自己所需要的资料,不仅需要遵循准、全、深、快的文献检索原则,更需要灵活掌握和运用文献检索的基本方法。常用的文献检索方法有: (一)基本方法1、文献信息检索的常用方法(1)顺查法 根据检索课题的起

16、始年代,利用检索工具,按照从旧到新、由远及近、由过去到现在的顺时序,逐年查找文献信息的方法。 查全率高。适用于围绕某一主题普查一定时期内的全部文献信息,或者说适用于那些主题较复杂,研究范围较大,研究时间较久的科研课题。 可用于事实检索,更多地用于文献检索。(2)倒查法 根据检索课题的起始年代,利用检索工具,按照从新到旧、由近及远、由现在到过去的逆时序逐年前推查找文献信息的方法。 查得的信息新颖性强,查全率不高。多用于新课题、新观点、新理论、新技术的检索。检索的重点在近期信息上。 (如:检索“藏青会”的相关信息)(3)抽查法 利用检索工具,针对某一学科的发展重点、文献信息量较大的阶段,选定一定时

17、间范围进行逐年检索的方法。 必须熟悉学科的发展特点,把握学科发展的高峰期和低谷期。(如:检索“克隆羊多莉”的相关信息)2、回溯法 也称引文法,是一种跟踪查找的方法,即以文献后面所附的参考文献和引文索引为线索,逐一追溯查找文献的方法。 适用于检索课题的背景和立论依据等方面的文献。 (如:科学引文索引(SCI)、中国科学引文索引(CSSCI)。) 3、循环法 是常用法和追溯法交替使用的方法,又称循环法或交替法,既利用检索工具,也利用文献后所附参考文献进行追溯,两种方法交替,分期分段使用,对获得一定年限内相当文献的资料线索,节省检索时间。 4、 浏览法 (积累法) 浏览法,是指研究人员平时对与本专业

18、或本学科相关的原始文献资料进行浏览、阅读和积累的一种方法。 常规法虽然可以在短时间内获得大量切合课题需要的文献,但是,出于任何一种检索工具都只能收录有限的期刊和图书,而且检索工具与原始文献之间一般有6个月左右的时间差,为了弥补这些缺陷,就需要研究人员及时阅读最新生产的原始文献,不断积累相关资料,跟踪学科发展的前沿。浏览法的优点是:能最快地获取信息;能直接阅读原文内容;基本上能获取本学科发展的动态和水平;缺点是科技人员必须事先知道本学科的核心期刊,检索的范畴不够宽,因而漏检率较大。有局限性,不全面,不系统,不能作为查阅文献的主要方法。四种方法可根据不同情况进行选择,检索中为省时,要充分利用累积索

19、引。选择检索方法的原则1、 如果检索工具不全和根本没有,检索课题涉及面不大。对查全率要求不高,可采用追溯法,用综述和评述最好2、 如工具完备,课题涉及范围大,采用常用法或综合法3、 如课题属于新兴学科或知识更新快的学科可用倒查法4、 如对查全率要求高,如开展查新,一般采用顺查法5、 如一掌握了课题发展规律、特点,一般采用抽查法(二)数据库和网络资源的检索方法1、浏览方法数据库类型浏览,按题录、文摘、全文浏览,按主题目录、导航、学科分类浏览。2、检索方法(1) 快速检索单检索:一般仅提供一个检索框输入检索式,并使用少数常用的检索字段。适合初级用户和构建比较简单的检索式(2) 专业检索利用分类导航

20、,按专业类目等级进行检索,是常用的检索方法(3) 期刊导航检索按年卷期浏览,期刊漫游(4) 分类检索按中图法做学科范围组合,灵活限制检索范围。(5) 相关主题检索(6) 高级检索高级检索或专家检索:适合熟悉检索指令并有检索经验的熟练用户使用。一般需要使用命令行式检索,通常需要使用字段标识符和布尔逻辑算符组配进行检索(7) 全文检索 按资料的内容检索,而不是按结构化特征来检索三、计算机检索技术在计算机信息检索过程中,为了提高检索效率,计算机检索系统常采用一些运算方法,从概念相关性、位置相关性等方面对检索提问实行技术处理。下面介绍几种常用的信息检索技术方法。(一) 主要检索技术【资料】基本运算符优

21、先算符 括号():如同数学运算符决定检索组配的先后次序。短语符 双引号:引号内的语句会被当成一个词进行检索。 “-”(连接符)“” (斜杠) “_”(下划线) “,” (逗号) “.”(点) 在不同的搜索引擎中也可作为短语连接符。加号(+) 要求结果中必须包含某个特定的检索词,可在它前面加一个“+” 如“+数字图书馆”减号 (-)要排除含有某个特定检索词的网络信息,可以在它前面加一个“-” 如关于查office 2003的资料,但又不想要office 2000和 office 98的信息,检索提问式可以是“office 2003-office 2000-office 98” 通配符“*”在进行

22、简单检索时,可以在单词末尾加通配符来代替任意字母的组合(最多可代替5个小写字母) 但不能用单词的中间或开头。 1、布尔逻辑检索所谓布尔逻辑检索(Boolean Logical)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。它是机检系统中最常用的一种检索方法。逻辑算符主要有:And/与、Or/或、Not/非,分述如下:(1)逻辑“与”运算符为 And 或 * 。检索词A和检索词B用“与”组配,检索式为:A And B或者 A * B, 它表示检出同时含有A、B两个检索词的记录。逻辑与检索能增强检索的专指性,

23、使检索范围缩小,此算符适于连接有限定关系或交叉关系的词。(2)逻辑“或”运算符为 Or 或 + 。检索词A和检索词B用“或”组配,检索式为:A Or B或者 AB 它表示检出所有含有A词或者B词的记录。逻辑或检索扩大了检索范围,此算符适于连接有同义关系或相关关系的词。(3)逻辑“非”运算符为 Not 或 - 。检索词A和检索词B用“非”组配,检索式为:A Not B或者 A - B 它表示检出含有A词,但同时不含B词的记录。逻辑非和逻辑与运算的作用类似,可以缩小检索范围,增强检索的准确性。此运算适于排除那些含有某个指定检索词的记录。但如果使用不当,将会排除有用文献,从而导致漏检。布尔检索式优先

24、执行顺序通常是NotAndOr,在有括号的情况下,先执行括号内的逻辑运算,在多层括号时,先执行最内层括号中的运算。布尔检索比较容易掌握,但使用不当会造成大量漏检和误检,特别是非运算符的运用应特别小心,否则会把有用的文献排除了。2、截词检索(截词符*和?)截词检索(Truncation)是指用给定的词干做检索词,查找含有该词干的全部检索词的记录。因此,也称词干检索或字符屏蔽检索。就是将通配符如“*”、“?”或“$”等,放在检索词中检索者认为合适的地方截断,用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中文献。这样,检索者不必输入完整的检索词。它可以起到扩大检

25、索范围,提高查全率,减少检索词的输入量,节省检索时间,降低检索费用等作用。检索时,若遇到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方法。在实际检索中,常遇到词干相同、词义相近的检索词,或同一词的单、复数形式,动、名词形式,英美拼法等。截词的方式有多种,按截断部位可分为后方截词、前方截词、中间截词等;按截断长度(字符数量) 可以分为有限截词和无限截词。(1)后方截词截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例如:输入geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、geology等词的记

26、录检索出来。若输入PY=199?,会把90年代的记录全部查出来。(2)前方截词截去某个词的前部,是词的后方一致比较,也称后方一致检索。例如:输入?magnetic 能够检出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等词的记录。(3)中间截词截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。例如:输入organi?ation可以检出organization、organisation;输入f?t可查出foot、feet。(4)有限截词是指允许截去有限个字符。例如“acid? ?”表示截去一个字符,它可检出acid、aci

27、ds,但不能检出acidic、acidicity、acidity等词。又如comput? ?可检出compute、computer、computers、computing等词,不能检出computable、computation、computerize等词。注意:词干后面连续的数个问号是截断符,表示允许截去字符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定要注意。(5)无限截词无限截断是指允许截去的字符数量不限,也称开放式截断。上面右截断、左截断所举的例子均属此类型。在实际检索时,我们还需要注意这样几个方面:一是任何一种截词检索,都隐含着布尔逻辑检索的“或”运算。采用截词

28、检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将增加检索噪声,影响查准率。另外,就是不同的机检系统使用的截词符不同、各数据库所支持的截断类型也不同, 截词检索主要是利用检索词的词干或不完整的词形进行检索。 截词符一般用“?”、“ *”、“”表示(是引用单元格函数)后方截词:用于前方一致的派生词检索。 如:信息? 则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为命中文献。前方截词:用于后方一致的派生词检索。 如:?经济 则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献。*: 至少键入一个词的前3个字符,3、位置运算符检索(常用

29、语外文数据库) 不讲当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,可使用位置算符。位置检索(Proximate)是在检索词之间使用位置算符(也称邻近算符Adjacent Operators),来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。这种方法能够提高检准率。机检系统中常用的位置算符(按限制强度递增顺序排列)如下:(1)(w)算符With或()和 (Nw)(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N个词

30、(N为自然数),词序不得颠倒。例如 input(w)output可检出input output而wear(1w)materials可检出wear materials、wear of materials e (2)(n)算符near和(nN)(n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1、2、3),且词序任意。例如 information(n)retrieval 可以检出 information retrieval 和 retrieval information,(3)(f)算符Fie

31、ld要求被连接的检索词出现在同一字段中,字段类型和词序均不限。例如 happiness(f)sadness and crying 又如 pollution(f)control/ti,ab(4)(s)算符Sub-field/Sentence要求被连接的检索词出现在同一句子(同一子字段)中,词序不限。例如 machine(s)plant但需要需要说明的是,不同的机检系统,位置检索的功能及算符不同,应参看各系统的说明。对于全文型数据库,特别是进行全文字段检索时,使用位置算符往往更理想 4、限制检索特定年代、特定类型(filetype)、特定检索点等做限制。限制检索(Range)是通过限制检索范围,达

32、到优化检索结果的方法。限制检索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等。1、基本字段限制检索字段检索是把检索词限定在某个字段中,如果记录的相应字段中含有输入的检索词则为命中记录,否则检不中。题名(TI) 关键词ID或k 主题词DE 分类号CC全文(FT,Full text) 作者AU期刊名JN 出版机构py 语种LA 文件类型 DT例如:查找wang wei写的文章,可以输入检索式:auwang wei 2、使用限制符使用限制符就是用表示语种、文献类型、出版国家、出版年代等的字段标识符来限制检索范围 尽管网上信息检索不分字段,但大多数网络工具搜索引擎都具有类似于字段限定检

33、索功能,依此功能,可以将检索范围限定在特定的范围中。文献类型的限定 检索词 filetype:ppt(doc pdf xls swf) 范例 保护生物学 filetype:ppt关键词出现的位置限定 如: intitle 检索词 (按网页标题搜索) 范例 保护生物学 intitle:研究所把搜索范围限定在某个站点中,提高查询效率。按网域(站)搜索 范例 姚明 site:把搜索范围限定在url链接中inurl (按URL搜索)【检索算符】inurl基本查询语法:inurl:资源类型+关键词如:输入inurl:MP3刘欢表示搜索可能有刘欢的mp3音乐网站。 网页url中的某些信息,常常有某种有价值

34、的含义。因此对搜索结果的url做某种限定,就可以获得良好的效果,可提供非常精准的专题资料。 范例 photoshop inurl:jiqiao3、使用限制指令限制指令可以分为:一般限制指令(Limit,它对事先生成的检索集合进行限制)、全限制指令(Limit all,它是在输入检索式之前向系统发出的,它把检索的全过程限制在某些指定的字段内)。例如:Limit S5/328000-560000 表示把先前生成的第5个检索集合限定在指定的文摘号内。又如:Limit all/de,ti 表示将后续检索限定在叙词和题名字段。上述几种限制检索方法既可独立使用,也可以混合使用。使用辅助索引字段时要用前缀标

35、识符,即在限制检索符后加等号“=”,再加检索词(如上例中的LA=)。应当注意,各数据库的前后缀代码的数量和形式有所不同,在检索某一数据库,需参考有关说明材料。DIALOG系统蓝页中的检索选择项(Search Option)提供了可检字段说明;利用联机HELP功能,输入指令“? FIELDn”(n为数据库文档号)可以查阅任何文档可检字段用法一览表。(二)辅助性检索技术1、 加权检索和聚类检索(引文检索、相关检索、垮裤检索)加权检索是指根据检索词对检索课题的重要程度,事先指定不同的权值。检索时,系统先查找这些检索词在数据库记录中是否存在,并对存在的检索词计算它们的权值总和;凡是在用户指定的临界值(

36、称阈值)之上者作为命中记录被输出。阈值可视命中记录的多寡灵活地进行调整,阈值越高,命中记录越少。2、 二次检索3、 题录标识检索4、 匹配检索任意一致、完全一致 前方一致 5、 利用检索工具(三)数据库检索方法1、 检索词的确定(1) 优先使用检索系统规范化词表中的专业词汇(2) 选用通用的术语和词汇(3) 分析课题的实质内容,找出隐含的主题(4) 以课题核心概念为主,排除无关概念,归并重复概念(5) 用上位或下位的概念词2、 编制合理的检索式定义:是实现检索策略,达到预想检索结果的具体形式。(1) 扩大或缩小检索文献量,排除不相关 文献。(2) 多主题概念组配,检索式应以简为主。3、 选择检

37、索系统和数据库四、文献检索步骤信息检索的步骤课题分析研究课题选择检索工具制定检索策略调整检索策略确定检索途径初步检索结果选定检索方法获取原始文献结果图2-5 信息检索的具体步骤示意图1、分析研究检索课题的要求 明确主题概念任何检索课题都是在一定范围内依据已知条件查找未知信息的过程。每项检索课题都有明确的目的和具体的要求,目的越明确,范围越具体,掌握的线索越多,查获所需文献信息的可能性就越大。一般在进行课题检索之前从以下三个方面分析入手:(1)分析研究课题的主题内容,即研究课题的所属学科、性质、特点,涉及多学科内容的检索课题,要找出其主要研究对象,确定检索课题所属学科、专业,从而准确把握检索课题

38、核心内容的主题概念。(2)确定研究课题所需的文献类型。由于现代科技文献的种类较多,并且所报道的内容各有侧重,如属于基础理论性研究的,一般侧重查找期刊论文,会议论文。如果是尖端科学技术,则应侧重于科技报告。如属于发明创造、技术革新,应侧重于专利文献。如为产品定型设计,则需利用标准文献及产品样本。 (3)根据研究课题的背景信息确定出文献检索的时间范围。检索的时间范围一般据研究课题的具体情况而定,如进行课题查新,需要检索近10年的文献;若为了掌握动态或解决某个问题,则以满足具体需要为准,确定检索时间范围。2、选择检索工具和数据库选择检索工具要根据检索课题的学科、专业特点以及所需文献类型,充分考虑检索

39、工具报道文献的学科专业范围、文献类型、文种是否符合需要;了解所选检索工具对文献揭示的深度、提供的检索途径、报道的时差等因素。注重利用权威性的检索工具,同时注意将综合性与专业性和单一性的检索工具结合使用。并优先选择机读型检索工具,以争取最佳的检索效率。数据库选择原则 (1)按照课题的检索要求和目的,选择收录文献种类、专业覆盖面、年代跨度对口的数据库。(2)当需要查找最新文献信息时,选择数据更新周期短的数据库。(3)当需要获取原文时,选取原文获取较容易和数据库。(4)要选好数据库,就要弄清所选数据库的标引特征、不同检索特点等。3、确定检索途径和检索标识在利用检索工具查找文献信息时,主要是利用检索工

40、具的各种索引,每种索引提供一种文献信息检索途径,一般来说每种检索工具都为用户提供几种检索途径,归纳起来一般可以分为四种:分类途径、主题途径、作者途径、题名途径、号码等其他途径。信息检索与信息存贮是互逆的过程,存贮在检索工具和系统中的数据,有些著录项或标引字段是可以提供检索的,这些著录项或标引字段就是检索的入口。检索词是构成检索式的基本单元,是文献记录中的文献特征标识,可以是反映文献内容特征的主题词、自由词,也可以是反映文献外表特征的作者、篇名等。检索词的选择要满足匹配的要求,即形式的匹配和内容的匹配。检索标识的定义 检索标识,即检索词,是指能表达检索课题主题概念和信息需求的名词术语、分类号、名

41、称及代码等的总称。检索标识是指通过对查新项目的主题分析将自然语言转换成规范化语言,即确定检索入口的问题,包括分类号标识和主题词标识,这是影响检索质量全面准确的一个很重要的因素。检索标识的确定检索标识必须反映课题内容和信息需求。检索标识和数据库的标引标识应一致。所选检索工具或系统具有叙词表或主题词表的,优先选用叙词或主题词作为检索词。要从词表规定的专业范围出发,选用各学科内具有检索价值的基本名词或术语。如检索词为自由词,应选取其同义词、近义词、广义词、狭义词、分子式、分类号、登记号、专利号、化学物质俗名、商品名等,使用多个词试检,或通过逻辑“或”组配进行检索。4、选择检索方法文献信息检索方法可归

42、纳为追溯法、常用法和综合法三种。在检索文献信息时可根据检索课题的不同要求,选择不同的检索途径,以达到省时省力查全的效果。5、调整检索策略,筛选文献结果检索策略是为了实现检索目标而制定的全盘计划和方案,是对整个检索过程的谋划和指导。所以检索策略,就是在分析信息需求实质的基础上,确定检索途径与检索用词,并明确各词之间的逻辑关系与查找步骤的科学安排。检索式是狭义上的检索策略,又称提问逻辑,就是对多个检索词之间的相互关系和检索顺序作出的某种安排。是检索策略的具体表述,是通过逻辑算符、位置算符、截词算符等把表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容,又能被机器识别和执行,是决定检

43、索策略质量和检索效果的重要因素。6、查找文献线索 查找原始文献上述步骤完成后,即可利用所选择的检索工具进行具体的检索。但在用分类途径或主题途径检索时,可能会出现检索提问标识和文献存储标识不一致而查不到合适的文献的情况,这时应反复修改检索提问标识,直至检索到适合的文献为止。 当检索到研究课题的相关文献后,应仔细阅读文献著录条目的内容,判定是否有参考价值,如符合检索需要,则要准确记录下文献的分类号、题名、著者、出处和入藏号等,以便索取原始文献,并用以积累资料。 查找原始文献,一般是由近而远,首先从本单位、本地区的文献资源着手,然后利用全国性的文献联合目录。 利用互联网进行文献的查找和获取目前已成为

44、用户方便、快捷的远程获取原始文献的一种发展趋势。五、检索效果分析(一)检索效果的评价检索效果是指检索结果的有效程度,反映了检索系统的检索性能和检索能力。1、文献检索的基本要求第一,要“全”。文献查阅越全面,对自己的观点及论据的完整帮助越大。只有广泛阅读视野放宽,才不至于偏听偏信。第二,要“准”。现在学术界流行许多病症,诸多情况皆因为查阅文献失实或者不善推敲,以致囫囵吞枣。其病概分三类:一是生吞活剥断章取义,二是曲解引申主观臆测,三是相互转抄以讹传讹,这都是极不负责的态度,是学术研究的大敌。 第三要求“快”第四,要勤于积累。要有意识地建立自己的资料库,平时注意做摘要、札记、卡片等。第五,要善于思

45、考。文献资料也是良莠不齐的,里面也有假冒伪劣。因此要将“死”书读“活”,就显得十分关键。只有善于思考才能在查阅文献时发现新问题,才会有理论研究的敏感(资料来源:裴娣娜教育研究方法导论,安徽教育出版社,1995年版 第三条自己加)2、评价检索效果常用的指标检索效果是指检索结果的有效程度,反映了检索系统的检索性能和检索能力。评价检索效果常用的指标有收录范围、查全率、查准率、响应时间和输出形式等,其中,查全率和查准率是最重要的也是最常用的指标。查全率是指检索出的相关文献与系统中的相关文献总量之比,又称“命中率”。可表示为:查全率R检索出相关文献量系统中的相关文献总量100查准率是指检索出的相关文献量与检索出的文献总量之比,又称“相关率”。 可表示

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com