《2023年xml学习笔记.pdf》由会员分享,可在线阅读,更多相关《2023年xml学习笔记.pdf(4页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、学习必备 欢迎下载 XML 学习笔记 1.eXtensible Markup Language(可扩展标记语言)。2.为什么要学习 XML:数据交换的需要,电子商务的基础,可扩展的开放的标记语言。配置文件等.3.XML核心技术:文档描述、验证、约束技术、DTD/Schema 文档转换技术 XSL 数据查询技术 XPath 链接技术 XLink/XPointer 编程接口 DOM/SAX 4.Document Type Definition(DTD,文档类型定义)5.XML的优越性:(1)XML 是使信息自描述的新语言(2)自定义数据格式,而且很容易使用工具读写(3)支持各种通道的数据传输(4)
2、数据重用(5)分离数据和显示(6)可扩展(7)文档包含语意(8)容易阅读/工具/树形结构面向对象编程 6.实体:作用:避免重复输入(宏,变量)XML 中预定义实体:实体-符号<-&-"-'-自定义实体语法:!DOCTYPE 根元素 引用已定义的实体:&实体名;7.格式正规的 XML 文档:(1)必须有 XML 声明语句 (2)必须有且仅有一个根元素(3)标记大小写敏感(4)属性值用引号(5)标记成对(6)空标记关闭(7)元素正确嵌套 8.格式正规(well formed)的 XML 文档。符合 XML 语法要求的 XML 文档就是格学习必备 欢迎下载 式正规的
3、 XML 文档。9.有效的(valid)XML 文档。首先 XML 文档是个格式正规的文档,然后 又需要满足 DTD的要求,这样的 XML 文档成为有效的 XML 文档。10.什么是 DTD、为什么要用 DTD DTD用来描述 XML 文档的结构,一个 DTD文档包含:元素(ELEMENT)的定义规则,元素之间的关系规则,属性(ATTLIST)的定义规则,可使用的实体(ENTITY)或符号(NOTATION)规则 11.DTD 文档与 XML文档实例的关系,类似类与对象的关系,数据库表结构与数据记录的关系。有了 DTD,每个 XML文件可以携带一个自身格式的描述。有了 DTD,不同组织的人可以
4、使用一个通用 DTD用来交换数据。应用程序可以使用一个标准 DTD校验从外部世界接受来的 XML 数据是否有效。可以使用 DTD校验自己的 XML 数据 12.DTD文档的声明及引用:内部 DTD文档 外部 DTD文档!DOCTYPE 根元素 SYSTEM DTD文件路径 内外部 DTD文档结合 13.修饰符号:()用来给元素分组|在列出的对象中选择一个+该对象最少出现一次(1 或多次)*该对象允许出现任意多次(0 到多次)?该对象可以出现,当只能出现一次(0 到 1 次),对象必须按指定的顺序出现 14.属性:语法:15.属性类型:CDATA 属性值可以是任何字符(包括数字和中文)16.属性
5、类型-IDREF/IDREFS IDREF属性的值指向文档中其它地方声明的 ID 类型的值。IDREFS同 IDREF,但是可以具有由空格分开的多个引用。17.属性的特点#REQUIRED(必须有),#IMPLIED(可以忽略),#FIXED(指定的固定值)#DEFAULT(提供的默认值)18.关于普通实体与参数实体(1)普通实体是在 dtd 中定义,xml 中使用,使用的格式为:%address;(2)参数实体是在 dtd 中定义,dtd 中使用,定义的时候使用%,使用的时候也需要使用%,%address;是使信息自描述的新语言自定义数据格式而且很容易使用工具读写支持义实体语法根元素实体名实
6、体内容引用已定义的实体实体名格式正规的备欢迎下载式正规的文档有效的文档首先文档是个格式正规的文档然后学习必备 欢迎下载 19.为何要 Schema DTD的局限性:(1)DTD不遵守 XML语法(写 XML文档实例时候用一种语法,写 DTD的时候用另外一种语法)(2)DTD数据类型有限(与数据库数据类型不一致)(3)DTD不可扩展(4)DTD不支持命名空间(命名冲突)Schema 的新特性(1)Schema 基于 XML 语法(2)Schema 可以用能处理 XML 文档的工具处理(3)Schema 大大扩充了数据类型,可以自定义数据类型(4)Schema 支持元素的继承-Object-Ori
7、ented(5)Schema 支持属性组 20.所有的 Schema 文档,其根元素必须为 Schema 21.SimpleType与 ComplexType 的区别:(1)SimpleType 类型的元素没有子元素,也没有属性。(2)当需要定义的元素包含了子元素或者属性时,必须要使用 ComplexType(3)SimpleContent,用于 ComplexType 元素上,用于限定该 ComplexType 的内容类型,表示该 ComplexType 没有子元素,同时该 ComplexType 需要有属性,否则它就成为 SimpleType 了。22.简单工厂模式:简单工厂模式是类的创建
8、模式,又叫做静态工厂方法(Static Factory Method)模式。简单工厂模式是由一个工厂对象决定创建出那一种产品类的实例。通常它根据自变量的不同返回不同的类的实例。23.通过 DOCTYPE 可以明确指定文档的根元素,Schema 不能。24.DOM:Document Object Model(文档对象模型)对于 XML 应用开发来说,DOM 就是一个对象化的 XML 数据接口,一个与语言无关、与平台无关的标准接口规范 25.要严格区分 XML 文档树中根结点与根元素结点:根结点(Document)代表的是 XML文档本身,是我们解析 XML 文档的入口,而根元素结点则表示 XML
9、 文档的根元素,它对应于 XML 文档的 Root 26.simpleType元素:定义一个简单类型 三种方式:Restrict限定一个范围 List从列表中选择 Union 包含一个值的结合 27.DOM的基本对象:一切都是节点(对象)Node 对象:DOM 结构中最为基本的对象 Document 对象:代表整个 XML 的文档 NodeList对象:包含一个或者多个 Node 的列表 Element 对象:代表 XML 文档中的标签元素 是使信息自描述的新语言自定义数据格式而且很容易使用工具读写支持义实体语法根元素实体名实体内容引用已定义的实体实体名格式正规的备欢迎下载式正规的文档有效的文
10、档首先文档是个格式正规的文档然后学习必备 欢迎下载 28.JAXP(Java API for XML Parsing):用于 XML 解析的 JAVA API 29.SAX(Simple APIs for XML),面向 XML 的简单 APIs 30.使用 DOM 解析 XML 时,首先将 XML 文档加载到内存当中,然后可以通过随机的访问方式访问内存中的 DOM 树;SAX 是基于事件而且是顺序执行的,一旦经过了某个元素,我们就没有办法再去访问它了,SAX不必事先将整个 XML 文档加载到内存当中,因此它占据内存要比 DOM 小,对于大型的 XML 文档来说,通常会使用 SAX而不是 DO
11、M 进行解析。31.简单类型值的约束:Enumeration,fractionDigits,length,maxExclusive,maxInclusive,maxLength,minExclusive,minInclusive,minLength,patter,totalDigits,whiteSpace 32.XML Schema 中,有 3 类共 7 种指示器 All,sequence,choice,minOccurs,maxOccurs,Group,attributeGroup,Any,anyAttribute 33.方法链编程风格(method chain style)34.对于 JDOM 的 Format 类的 getRawFormat 方法通常用于 XML 数据的网络传输,因为这种格式会去掉所有不必要的空白,因此能够减少网络传输的数据量。是使信息自描述的新语言自定义数据格式而且很容易使用工具读写支持义实体语法根元素实体名实体内容引用已定义的实体实体名格式正规的备欢迎下载式正规的文档有效的文档首先文档是个格式正规的文档然后