数据库基本概念在专利检索中的运用陈卫明.ppt

上传人:赵** 文档编号:65371500 上传时间:2022-12-05 格式:PPT 页数:81 大小:565KB
返回 下载 相关 举报
数据库基本概念在专利检索中的运用陈卫明.ppt_第1页
第1页 / 共81页
数据库基本概念在专利检索中的运用陈卫明.ppt_第2页
第2页 / 共81页
点击查看更多>>
资源描述

《数据库基本概念在专利检索中的运用陈卫明.ppt》由会员分享,可在线阅读,更多相关《数据库基本概念在专利检索中的运用陈卫明.ppt(81页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、数据库基本概念在专利检索中数据库基本概念在专利检索中的运用的运用陈卫明 许瑛 姚文 闫小苏2007.7.23 1目录目录n1 1、数据、信息和数据处理、数据、信息和数据处理 n2 2、数据库系统概述、数据库系统概述 n3 3、关系型数据库的三种操作、关系型数据库的三种操作 n4 4、布尔逻辑运算(集合运算)、布尔逻辑运算(集合运算)n5 5、三种字段类型、三种字段类型 21 1、数据、信息和数据处理数据、信息和数据处理n1.1、三个世界n按照数据库理论,有现实世界、信息世界、计算机世界等三个世界。n现实世界的“客观事物”(事实、事件)在信息世界中抽象为“实体”,并定义了各种“属性”来描述“实体

2、”。n“实体”在计算机世界被描述成一条“记录”。n客观事物-实体-记录31 1、数据、信息和数据处理、数据、信息和数据处理n1.2、数据(data)是一些符号,用来描述客观事物的特征。n这些符号可以是数字形式、文字形式(以及图形、图像和声音等)。n例如学生成绩、飞机班次、测量温度、(CPRS中的)发明人姓名、发明名称、文摘、优先权项、文献号、申请号、分类号、申请日、公开日等。41 1、数据、信息和数据处理、数据、信息和数据处理n1.3、信息(information)n信息是经过加工(记载、分类、组织、关联、解释、提炼、消化理解)而具有使用价值的数据。(信息=数据+数据处理)n有的信息由一个数据

3、构成,比如分类号;有的信息由几个数据构成,比如优先权项、CPRS中的一条记录。n数据和信息在形式上往往并无区别,尤其是那些由一个数据构成的信息。例如分类号。5一、数据、信息和数据处理一、数据、信息和数据处理n1.4、数据和信息的关系n(信息是数据的内涵、二者是形与质的关系。)n(数据是信息的载体,信息的表现形式仍是数据。)n(信息是经过加工而具有使用价值的数据,信息=数据+数据处理。)n数据只是把客观事物记录下来,并没有特定目的;而信息是有针对性的(某一问题、某一论点、某一特定目的)来收集、处理数据,用来作为决策或参考的依据。所以两者的差别在于是否存在某一特定目的特定目的。61 1、数据、信息

4、和数据处理、数据、信息和数据处理n1.5、数据处理n数据处理是指对各种类型的数据进行加工(收集、存储、分类、计算、检索、传输)的过程。n数据处理的目的使之成为信息。n数据处理通常也称为信息处理。72 2、数据库系统概述、数据库系统概述n2.1、数据库(Datebase,DB)n长期存放在外部存储设备(外存储器、外存介质)上、可以以各种方式进行组织、可以共享的数据(包括这些数据之间的联系)集合。n(这些数据与应用程序例如VB相互独立)82 2、数据库系统概述、数据库系统概述n2.2、数 据 库 系 统(Database System,DBS)n数据库不能独立存在,是数据库系统的一部分。n在实际应

5、用中,人们所面对的其实是数据库系统。n数据库系统具有管理和控制数据库的能力(输入、输出、组织数据)。92 2、数据库系统概述、数据库系统概述数据库系统包括:n硬件(计算机)n数据库(DB)n数据库管理系统(DBMS,常用的数据库管理系统有FoxPro、Oracle、SYBASE、INFORMIX等,用来建立、管理、控制数据库)n数据库管理员n用户和应用程序102 2、数据库系统概述、数据库系统概述n2.3、信息世界的术语n实体(Entity)对应于现实世界中的“客观事物”。实体可以指代具体事物,如一个学生,一本书(一件专利文献);也可以指代抽象事件,如一场足球比赛。112 2、数据库系统概述、

6、数据库系统概述n属性(attribute)n属性用来描述实体的特性。n如学生实体可以用若干属性(学号、姓名、年龄、性别、出生日期、班级)来描述。n属性的具体值称为属性值,如CN2745142Y(授权公告号)、马林(申请专利权人)、2004年9月16日2004.9.16(申请日)是属性值。122 2、数据库系统概述、数据库系统概述n2.4、计算机世界的术语n记录(record)、元组对应于信息世界的“实体”,二维表中的一行。n字段(field)对应于信息世界的“属性”,二维表中的一列。每个字段有字段名(标头),例如“发明人”、“申请号”等等。n字段值(value)、数据项对应于信息世界的“属性值

7、”,二维表中的一格。n关系(relation)、数据库文件132 2、数据库系统概述、数据库系统概述n一个关系就是一个二维表,每个关系有一个关系名。一个关系可以存储为一个数据库文件。n例如某专利文献数据库可以有专利号的表,发明名称的表,专利权人的表等。n下面是一个模拟数据库,该表是由一个以上的表(关系)通过“关联”而成。14PN(PN(字段名字段名)TIPAICPDPD5000000(5000000)carG&MB60j31/0010/25/1998(一行表示一条记录)(5000001)computerIBMG06f3/0001/02/2000模拟数据库(不是真的)(一列表示一个属性)2 2、

8、数据库系统概述、数据库系统概述152 2、数据库系统概述、数据库系统概述n2.5、关系的三种类型n一对一的关系(例如一个学生只有一个学号;再例如一件专利只有一个申请号)n一对多的关系(例如某班主任老师可以有多个学生,再例如一个发明人可以有多件专利)n多对多的关系(例如一个学生可以选修多门课,一门课可以供多名学生选修;再例如一个分类号之下可以有多件专利文献,一件专利也可以有多个分类号)162 2、数据库系统概述、数据库系统概述n2.6、数据库的三种类型n数据模型是数据库结构的组织形式,目前数据库系统中常用的数据模型有三种:n层次模型(Hierarchical Model):用树形结构表示数据及其

9、联系的数据模型,树形结构只能表示一对多联系:17班主任(微机871班)王小艳李峰张勇2 2、数据库系统概述、数据库系统概述182 2、数据库系统概述、数据库系统概述n网状模型(Network Model):用网络结构表示数据及其联系的数据模型。n网状模型可以直接表示多对多联系,但其中的结点间连线或指针更加复杂,因而数据结构更加复杂:19dl001(刑法)王小艳李峰张勇dl002(声乐)dl003(绘画)2 2、数据库系统概述、数据库系统概述202 2、数据库系统概述、数据库系统概述n关系模型(Relational Model):用关系表示的数据模型。n关系是指由行与列构成的二维表,关系不但可以

10、表示实体间一对多的联系,通过关系间的连接,也可以表示多对多的联系(见连接):21学号姓名年龄性别班级870101王小艳18女微机871870102李峰18男微机871870103张勇19男微机871微机871班学生表(A)2 2、数据库系统概述、数据库系统概述22学号课程编号课程编号870101(王)dl001(刑)870101(王)dl002(声)870102(李)dl001(刑)870102(李)Dl002(声)870103(张)Dl002(声)870103(张)dl003(画)选修表(B)2 2、数据库系统概述、数据库系统概述23课程编号课程编号课程名授课教师授课地点dl001刑法周火主

11、楼102教室dl002声乐刘琴主楼102教室dl003绘画任安主楼504教室课程表(C)2 2、数据库系统概述、数据库系统概述243 3、关系型数据库的三种操作、关系型数据库的三种操作n3.1、选择:从关系中找出满足给定条件的记录(元组),即在二维表中选行。(例(例如:对表A中李峰的选择)n3.2、投影:从关系中找出若干字段(属性)组成新的关系,即在二维表中选列。(例如:对表B课程编号的投影)n3.3、连接:将两个关系按某种条件提取部分(或全部)记录及部分(或全部)字段组合成新的关系。(例如:表B、表C按照课程编号关键字连接)25课程编课程编号号课程名授课教师授课地点学号dl001刑法周火主楼

12、102教室870101、870102dl002声乐刘琴主楼102教室870101、870102、870103dl003绘画任安主楼504教室870103连接而成的新表(D)3 3、关系型数据库的三种操作、关系型数据库的三种操作264 4、布尔逻辑运算(集合运算)、布尔逻辑运算(集合运算)n4.1、并(或、or)(AB)nA集合和B集合所有元组合并,再删去重复的元组,这种运算称为“并”(或);所组成新的C集合,称为A、B的并集n4.2、差(非、not)(A-B)nA集合中删去(A集合中)与B集合相同(重复)的元组,这种运算称为“差”(非);所组成新的C集合称为A、B的差集n4.3、交(与、and

13、)(AB)n既属于A集合又属于B集合的元组,这种运算称为“交”(与);所组成新的C集合,称为A、B的交集27交(交(,与,与,andand)n属于集合A且属于集合B的元素组成的集合C,叫做A,B的交集(属于A又属于B的元素组成的集合,A and B=C)n例:A-汽车,B-发动机,C-即有汽车也有发动机的记录集ncaps中两词间空格,“and”,“+”集合B集合A集合C28并(并(,或,或,oror)n属于集合A或属于集合B的元素组成的集合C,叫做A,B的并集(A,B所有元素合并,删除重复元素组成的集合,A or B=C)。n例:A-汽车,B-发动机,C-仅有汽车的记录集,仅有发动机的记录集,

14、即有汽车也有发动机的记录集。ncaps中用“or”,“,”集合A集合B集合C29差(差(-,非,非,NOTNOT,与非,与非,ANDNOTANDNOT)n属于集合A而不属于集合B的元素组成的集合C,叫做A,B的差集(在A中排除属于B的元素后组成的集合,A not B=C)n例:A-汽车,B-发动机,C-从所有含汽车的记录集中去掉含发动机的记录集ncaps中用“without”,“not”,“#”集合A集合B集合C304 4、布尔逻辑运算(集合运算)、布尔逻辑运算(集合运算)n4.4、差并(ornot、或非)n从总集合排除B,再与A集合合并。n三种情况n4.4.1、A集合的所有元素都是B集合的元

15、素时,还要考虑A集合与B集合哪个更大:n4.4.1.1、如果A集合更大,或非结果=总集合;n4.4.1.2、如果B集合更大,总集合被挖去部分B只填入了局部,有“空区”)314 4、布尔逻辑运算(集合运算)、布尔逻辑运算(集合运算)n4.4.2、A集合的所有元素都不是B集合的元素,或非结果=总集合 not Bn4.4.3、A集合的部分元素是B集合的元素,总集合被挖去部分B只填入局部,有“空区”)32总BA或非(4.1.1.1、A所有元素都是B的元素,且AB)33总或非(4.1.1.1、A所有元素都是B的元素,且AB)34或非(4.1.1.2、A所有元素都是B的元素,且AB)总BA35总或非(4.

16、1.1.2、A所有元素都是B的元素,且A”;必须输入完整的年月日(YYMMDDYYMMDD),例如:850101020831;可用YYYY和YY;年月日格式;连续输入时可用“+”785 5、三种字段类型、三种字段类型n情形3:USPTO的“patent search”(ISD授权日PD公开日/APD申请日/PRIR优先权日),输入值间不能用or,“日”可用“$”,时间区间用“-”。授权专利数据库日期型输入值有多种输入格式:20030403、4-30-2003(月日年)、4/30/2003(月日年)、20030327-20030403(时间区间)n情形4:欧洲局的“espacenet”只有公开日检索框,不能使用范围检索,而且只能是YYYYMMDDn情形5:EPOQUE(OPD、ORDPD),年月日中间用“-”,范围检索更为精确 79算符意义举例=等于PD=1987-10-20小于PD大于PD1993-12=小于等于ORD=大于等于ORD=1994-10-30:范围PD=1994-01:1994-085 5、三种字段类型、三种字段类型80结束语n主要参考目录:n数据库原理与应用李春葆著 清华大学出版社n数据库的基本概念许瑛 讲稿n谢谢大家!81

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com