美国档案目录检索系统的最新进展.doc

上传人:创****公 文档编号:1864706 上传时间:2019-10-29 格式:DOC 页数:9 大小:114.50KB
返回 下载 相关 举报
美国档案目录检索系统的最新进展.doc_第1页
第1页 / 共9页
美国档案目录检索系统的最新进展.doc_第2页
第2页 / 共9页
点击查看更多>>
资源描述

《美国档案目录检索系统的最新进展.doc》由会员分享,可在线阅读,更多相关《美国档案目录检索系统的最新进展.doc(9页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、美国国家档案馆美国国家档案馆 ARCARC 检索系统的专名索引研究检索系统的专名索引研究崔屏 (南京政治学院上海分院信息管理系 200433)文文 摘摘 美国国家档案馆 ARC 检索系统的专名索引是在其原有系统上的新增功能,在结 构上它打破了传统专名索引的固有形式,使得索引的使用更为简便、信息量更为丰富,在 功能上它不仅具备了传统专名索引的所有功能,而且凭借其特有的结构,该索引能够满足 多种不同的检索需求,提高了检全率、检准率和检索方便性。本文就是从结构和功能这两 个方面分析研究了美国国家档案馆 ARC 检索系统的专名索引提高检索效率的内在机制,并 结合我国档案检索系统建设的现状提出完善我国档

2、案检索系统专名索引的若干策略。 关键词关键词 美国 ARC 检索系统 专名索引 机构名索引 人名索引随着人类社会进入数字时代,信息资源作为战略资源的地位日益突出,因此,世界各 国为了抢占信息资源这个制高点,无不投入巨资研究与开发信息资源检索系统。美国国家 档案馆 ARC 检索系统就是在国际档案领域众多的档案检索系统中一个最具代表性的信息检 索系统。该系统无论从检全率与检准率上看,还是从检索速度、检索方便性上看,都具有 很高的检索效率,尤其是该系统中的专名索引凭借其简洁独特的结构和详细丰富的内容信 息在很大程度上提高了系统的检索效率,从而使美国 ARC 检索系统在众多档案信息检索系 统中脱颖而出

3、。他山之石,可以攻玉,目前在我国各档案检索系统中,用于浏览检索用的 专名索引的建设几乎是空白,因此,借鉴美国国家档案馆 ARC 检索系统的经验,或许会给 我国档案信息化中的检索系统建设提供有益的启示。 1 1 美国国家档案馆美国国家档案馆 ARCARC 检索系统的概况检索系统的概况 美国国家档案馆的档案检索系统“ARC” ,其全称是“档案检索目录” ,英文名 为“Archives Research Catalog” , 该系统于 2002 年 10 月正式推出。ARC 的前身是“美国 国家档案馆信息检索系统” ,其全称为“NARA Archival Information Locator” ,

4、与“美 国国家档案信息检索系统”相比,ARC 检索系统不仅增强了原有的关键词检索功能,而且 还在系统中新增了档案专名索引,从而大大增强了系统的检索功能。 所谓专名索引,在这里注意要区分的是,它不是指计算机数据库内部所建的索引,专 名索引是指一种能够显示于计算机界面,将档案材料中的专有名词(如机构名、人名和地名)作 为索引的检索词,按字顺排列,为用户提供从专名途径浏览检索档案的一种索引,它的基 本原理和基本形式与传统手工检索工具中的档案索引相同,但是计算机中的专名索引其功 能却远比手工检索工具中的专名索引强大得多。美国国家档案馆 ARC 检索系统的专名索 引主要分为机构名索引和人名索引两类。 2

5、 2美国国家档案馆美国国家档案馆 ARCARC 检索系统机构名索引的结构分析检索系统机构名索引的结构分析美国国家档案馆 ARC 检索系统的机构名索引其基本结构与传统手工档案检索工具中的 机构名索引的最大不同是:ARC 的索引其基本结构分为“著录的简要级次部分”和“著录 的详细级次部分” , “著录的简要级次部分”其功能是使用户方便快捷地浏览,便于快速确 定其所需要查找的索引条目,以提高检全率;“著录的详细级次部分”其功能是提供机构 的详细背景信息,便于用户准确地确定是否是所需查找的档案材料,以提高检准率。 21 机构名索引著录的简要级次部分的款目结构分析美国国家档案馆 ARC 检索系统,其机构

6、名索引著录的简要级次部分的结构示例如下:机构名索引著录机构名索引著录的简要级次部分的款目结构(示例的简要级次部分的款目结构(示例 1 1)如示例 1 所示,我们可以看出机构名索引著录的简要级次部分,其款目结构的构成有 两类,一类是由“索引款目词”构成,用户检索到某一索引款目词后,就可直接链接到机 构名索引著录的详细级次部分,如示例 1 中的款目 6,就是这样的结构;另一类是由 “索 引款目词” 、 “用”参照符和“参照项”三部分构成,如示例子中的款目 1 至款目 5 就是这 样的结构。每条款目按款目词的字顺排列。采取这一种结构是因为在现实生活中,一个机 构很可能有全称、简称,或由于某种原因机构

7、的名称曾经改变过不止一次,在这种情况下, 一个机构实体就会对应多个不同的机构名称,如果用户对所检索的机构不熟悉,不能完全 掌握所检机构的所有名称则很容易出现漏检的情况。为了解决这个问题,在著录的简要级 次部分区设置了“用”参照,将各个机构名之间的用代关系清楚地显示出来,并将代表同 一机构的多个不同名称指引到最常用的规范名称上,并链接到机构名索引著录的详细级次 部分。这样一方面关于某一机构不同机构名的档案材料最大限度地集中,提高了检全率, 另一方面无论索引词是否是规范词都可以通过链接直接进入该机构的内容区,从而增加了 索引检索的入口,免去了分散多头查找的麻烦,提高了系统的检索方便性。 例如,示例

8、 1 中“ABC 电视广播公司”还有两个名称分别是款目 1 的“ABC 电视台” 和款目 2 的“ABCTV” ,虽然在索引中都将这三个名称都作为索引款目词列出,但款目 1 和款目 2 的索引款目词通过“用”参照指向了“ABC 电视广播公司”这一规范词,从而 使关于“ABC 电视台” 、 “ABCTV”的档案材料都被集中在了“ABC 电视广播公司”这 个规范词下,使用户不但免去了分散多头查找的麻烦,而且无论用这三个机构名中的哪一 个都可以快速准确地检索到关于该机构的所有档案材料。 2 22 2 机构名索引著录的详细级次部分的款目结构分析机构名索引著录的详细级次部分的款目结构分析机构名索引著录的

9、详细级次部分包括有丰富的机构背景信息,用以帮助用户详细地了 解机构的各方面情况,从而确定所查检的有关机构的档案材料是否符合检索需求,这对于 提高检准率很有帮助。根据各个机构的不同情况和检索者不同的检索需求,机构名索引著机构名索引著录的简要级次部分结构机构名索引著录的简要级次部分结构 A A 1 1AsAs ( (篮球队篮球队),), 用用 费城运动费城运动 (篮篮球球队队) 2 2A.B.A.,A.B.A., 用用 美国律师协会美国律师协会. 3 3A.C.L.U.,A.C.L.U., 用用 美国公民权利联盟美国公民权利联盟 4 4ABCABC 电视台电视台, , 用用 ABC 电视广播公司电

10、视广播公司 5 5ABC-TV,ABC-TV, 用用 ABC 电视广播公司电视广播公司 6 6ABCABC 电视广播公司电视广播公司索索 引引 款款 目目 词词“用用”参参 照照符符参参照照项项录的详细级次部分主要有以下三种款目结构:第一种结构的示例如下: 机构名索引著录的详细级次部分款目结构(示例机构名索引著录的详细级次部分款目结构(示例 2 2)如示例 2 所示的第一种结构,这种结构的索引款目只包含三个部分,即机构名称、条 目出处和链接,这是索引中的最基本的结构,与手工索引中的结构相同。这种结构适用于 机构名唯一,一般不会出现机构名混淆不清的情况,而且被大多数人所熟知的机构。如示 例 2

11、中的“南阿拉巴马大学”就属于这样的机构,当用户要检索有关南阿拉巴马大学的档 案材料时, 可直接通 过索引内 容区的超 链接得到 相关档案 材料信息。第二种 结构示例 如下:机构名索引著录的详细级次部分款目结构(示例机构名索引著录的详细级次部分款目结构(示例 3 3)如示例 3 所示第二种结构,这种结构的索引款目包括有六个部分,即机构名称、条目 出处、机构前身、机构现用名、多种称谓和链接。在这个索引款目中“机构现用名”是指 该机构目前使用的名称, “机构前身”指在该机构成立之前成立的与该机构有相似职能的机 构名称,通过这样两个著录项,就给用户提供了机构从过去到现在历史变迁的背景信息, 从而可以使

12、用户了解到该机构的历史沿革。象这样的款目结构适用于一些历史较悠久、机机机 构构 名:南阿拉巴马大学名:南阿拉巴马大学 条目出处:条目出处:以责任者身份出现在以责任者身份出现在 4 4 个类别中个类别中机机 构构 名:美国劳工联合会名:美国劳工联合会 条目出处:以主题词形式出现在条目出处:以主题词形式出现在 1 1 个条目中个条目中 机构前身:美加贸易与劳工联合组织同盟机构前身:美加贸易与劳工联合组织同盟 机构现用名:美国劳工联合会机构现用名:美国劳工联合会美国产业工会联合会美国产业工会联合会 多种称谓:多种称谓: AmerikanskaiaAmerikanskaia federatsiiafe

13、deratsiia trudatruda劳工联会劳工联会链链 接接链链 接接构名称变 化较大的 机构。对用 户而言, 一方面可 以使得与 该机构有 关的档案 材料都能 快速地被 检出,提高 了检全率, 另一方面 为用户区 别与该机 构同名的 机构提供 了判断的 依据,提高 了检准率。如示例 2 中的“美国劳工联合会”就属于这样的机构,当用户要检索有关美国 劳工联合会的档案材料时,一方面可以利用“美加贸易与劳工联合组织同盟” 、 “美国劳工 联合会美国产业工会联合会”这两个机构名检索到关于该机构更多的更全面的档案材料, 另一方面这两个机构名也有助于用户判断其所检的机构是否含有能满足其检索需求的档

14、案 材料。 第三种结构示例如下:机机 构构 名:立法部调查局名:立法部调查局 机构建立时间:机构建立时间:19341934 机构撤销时间:机构撤销时间:19351935 条条 目目 出出 处:处: 以责任者身份出现在以责任者身份出现在 5454 个条目中个条目中 机机 构构 授授 权:权: 联邦调查局是根据联邦调查局是根据 19351935 年年 3 3 月月 2222 日通过的一项日通过的一项 法案建立的,它隶属于立法部。在这项法案中还法案建立的,它隶属于立法部。在这项法案中还 将调查部更名为立法部。联邦调查局的主要工作将调查部更名为立法部。联邦调查局的主要工作 是执法和犯罪调查,其直属机构

15、是一个技术实验是执法和犯罪调查,其直属机构是一个技术实验 室和一个国立警官学校。此机构主要负责对犯罪室和一个国立警官学校。此机构主要负责对犯罪 证据档案的收集、整理、保存和利用工作。证据档案的收集、整理、保存和利用工作。 机构曾用机构曾用 名:名: FBIFBI 机机 构构 成成 员:员: 杰克杰克李,李, (1895-19721895-1972) 机机 构构 职职 能:能: 犯罪调查犯罪调查案件调查案件调查执法执法链链 接接机构名索引著录的详细级次部分款目结构(示例机构名索引著录的详细级次部分款目结构(示例 4 4)如示例 4 所示的第三种结构,这种结构包含九个部分,即机构名称、机构建立时间

16、、 机构撤销时间、条目出处、机构简介、机构曾用名、机构成员、机构职能和链接。 “机构曾 用名”指在该机构成立之前与该机构职能完全相同的机构的名称,以机构曾用名为机构名 所形成的所有档案材料是该机构档案材料中不可缺少的部分;“机构成员”指该机构的主 要成员,一般指该机构的法人代表或主要负责人,用户可以以这些人名为检索入口获得更 多关于该机构的档案材料;“机构授权”则提供了机构成立的历史背景及工作范围;而 “机构职能”则提供了机构主要职能的背景信息。 像示例 4 所示的这种结构,非常适用于一些已经撤销的、从其名称很难判断其性质、 职能的机构,因为它能为用户提供非常丰富的机构背景信息,从而为用户在检

17、索时判断该 机构是否符合自己检索需求提供了切实的依据。如示例 4 中的“立法部调查局”就属于这 样的机构,当用户要检索某一案件的档案材料时,想到了“立法部调查局”这一机构,但 又不能确定通过该机构名是否真能查到自己所需的档案材料,此时,通过索引著录的机构 授权、机构职能、机构成员等丰富的背景信息,用户就能很快确定该机构就是自己所要检 索的机构,然后通过链接,用户就能浏览到与该机构有关的档案信息了。 第四种结构示例如下:机构名索引著录的详细级次部分款目结构(示例机构名索引著录的详细级次部分款目结构(示例 5 5)示例 5 所示的第四种结构与示例 4 所示的第三种结构相比,其最大区别是,它将一 个

18、机构的多个曾用名的命名时间、更名时间、条目出处和链接都分别列出来了,这样不 但可以使一个机构的历史沿革清晰地显示出来,而且本质上是将一个的机构档案材料按 时间在进行分类,有了这样的结构,用户就可以根据一个机构在历史沿革中的不同发展 阶段选择不同的曾用名,从而检索到该机构不同历史发展阶段中的更为专指的档案材料, 对提高检准率非常有效。 像示例 5 所示的这种结构,特别适用于一些历史较悠久、名称和隶属关系更改较频 繁但职能一直以来没有变化的机构。如示例 6 中的“和平队”就属于这样的机构,当用 户检索到“和平队”这个索引词时,通过索引分别著录的“行动和平队” 、 “美国国家 部门和平队” 、 “和

19、平队”的机构名以及“命名时间”及“更名时间” ,就可以检索到该 机构在其历史沿革中特定机构名称的档案材料,从而大提高了检索的方便性。 机构名索引内容区机构名索引内容区机机 构构 名:名: 行动行动和平队和平队 命命 名名 时时 间:间: 07/01/197107/01/1971 更更 名名 时时 间:间:19821982 条条 目目 出出 处:处: 以责任者身份出现在以责任者身份出现在 7 7 个类别中个类别中机机 构构 名:名: 美国国家部门美国国家部门和平队和平队 命命 名名 时时 间:间: 03/03/196103/03/1961 更更 名名 时时 间:间:07/01/197107/01

20、/1971 条条 目目 出出 处:处: 以责任者身份出现在以责任者身份出现在 6 6 个类别中个类别中机机 构构 名:名: 和平队和平队 命命 名名 时时 间:间: 19821982 条条 目目 出出 处:处: 以责任者身份出现在以责任者身份出现在 1717 个类别中个类别中 机机 构构 沿沿 革:革: 和平队是根据政府部门和平队是根据政府部门 85-1185-11 号权威授权作为政府部号权威授权作为政府部门的行动中介组织而建立的,并于门的行动中介组织而建立的,并于 19611961 年年 3 3 月月 3 3 日日根据根据 19611961 年年 3 3 月月 1 1 日的日的 E.O.E.

21、O. 第第 1092410924 号决议正式建号决议正式建立。立。19611961 年年 9 9 月月 2222 日立法部门正式通过和平队法案,日立法部门正式通过和平队法案,自此,该机构被立法部门正式承认。根据自此,该机构被立法部门正式承认。根据 19711971 年第年第 1 1号重组计划该机构于号重组计划该机构于 19711971 年年 7 7 月月 1 1 号重组入新建机构号重组入新建机构-行动。根据行动。根据 E.O.E.O. 第第 1213712137 号决议该机构于号决议该机构于 19791979 年年5 5 月月 1616 号在行动机构内独立,又根据号在行动机构内独立,又根据 1

22、9811981 年国际安全年国际安全与发展协会第与发展协会第 6 6 号决议该机构成为一个无党派的机构。号决议该机构成为一个无党派的机构。和平队管理和协调联邦国际志愿者和国内志愿者计划。和平队管理和协调联邦国际志愿者和国内志愿者计划。 机机 构构 职职 能:能: 农业援助农业援助地区开发地区开发教育教育环境保护环境保护国家援助国家援助链链 接接3 3 美国国家档案馆美国国家档案馆 ARCARC 检索系统人名索引的结构分析检索系统人名索引的结构分析 美国国家档案馆 ARC 检索系统的人名索引与其机构名索引在结构与功能上是相同的, 也是由索引著录的简要级次部分与索引著录的详细级次部分这两部分组成的

23、,索引著录的 简要级次部分使用户方便快捷地检索到其所需要的人名,索引著录的详细级次部分使检索 者获得更为详细的人物背景信息。 人名索引著录的简要级次部分示例如下:人名索引著录的简要级次部分(示例人名索引著录的简要级次部分(示例 6) 如示例 6 所示,人名索引著录的简要级次部分的款目其基本结构也是由“款目索引词” 、 “用”参照和“参照项”三部分构成,并按索引款目词的字顺排列。如示例 6 所示,当用 户要检索“亚伦大卫”的相关档案材料时,直接按字顺查找,十分便捷。在现实生活中, 一人多名的情况很多,如果用户对所检人物不熟悉,没有掌握人物的其它名字则很容易出 现关于某人的档案材料漏检的情况。为了

24、解决这个问题,人名索引著录的简要级次部分将 设置了“用”参照,将一个人的其他名称指引到最常用的规范名称上。这样一方面关于某 一人物涉及不同名称的档案材料可以最大限度地集中,提高了检全率,另一方面无论索引 款目词是否是规范词都可以通过链接直接连接至人名索引著录的详细级次部分,免去了分 散多头查找的麻烦,提高了系统的检索方便性。 例如,示例 6 中“亚伦,哈里 J.”有两个其他名称,分别是“亚伦哈里”和“亚 伦哈里雅各布” ,虽然在索引中将这三个名称都作为索引款目词列出,但通过“用”参 照清楚地指向了“亚伦,哈里 J.”这一常用的规范词,这样用户无论用这三个人名中的哪 一个进行检索,都可以快速准确

25、地检索到关于该人物的所有档案材料,因为关于“亚 伦哈里”和“亚伦哈里雅各布”的档案材料都被集中在了“亚伦,哈里 J.”这一规 范索引词下了。 人名索引著录的详细级次部分,其典型的款目结构如示例 7:人名索引著录的简要级次部分示例人名索引著录的简要级次部分示例A A1 1亚伦亚伦大卫大卫2 2亚伦亚伦哈里哈里 用用 亚伦,哈里亚伦,哈里 J.3 3亚伦亚伦哈里哈里雅各布雅各布 用用 亚伦,哈里亚伦,哈里 J.4 4亚伦,琼亚伦,琼.5 5阿比,迈克尔阿比,迈克尔.6 6艾伯特,查尔斯艾伯特,查尔斯.索索 引引 款款 目目 词词“用用”参参 照照符符 参照参照 项项人名索引著录的详细级次部分的款目

26、结构(示例人名索引著录的详细级次部分的款目结构(示例 7)如示例 7 所示,这种结构包含五个部分,即人名、条目出处、人物生平、多种称呼和 链接。人物生平一般介绍人物的生卒年月、籍贯、重要任职等信息,这显然是帮助用户更 为详细地了解人物重要的背景信息,也为用户判断该人物的档案材料是否符合其检索需求 提供了重要依据。这种结构很适用于那些在政府或社会其它团体中任过重要职务,经历丰 富,社会影响重大的人物。如示例 7 中的乔布肯瑞德就是这样的人物,用户很可能听说过 或在检索相关档案的过程中遇到过乔布肯瑞德这个人,而通过人名索引的这条款目, 用 户不仅可以了解到有关于该人物的背景信息,而且还能找到更多关

27、于该人物的档案材料。 4 4美国国家档案馆美国国家档案馆 ARCARC 检索系统的专名索引的启示检索系统的专名索引的启示从以上分析可知,美国国家档案馆 ARC 检索系统的专名索引以其特有的结构使其具 有很好的检索功能,极大地优化了档案检索系统的检索效率,总的看来对我们有以下几点 启示: 档案检索系统建立专名索引是科学有效地开发档案信息资源的关键性措施 在计算机网络环境下建立档案检索系统,首先就要认识计算机网络环境下的检索与手 工环境下的检索的区别。在手工环境下,用户进行的档案检索是本地的、面对面的、直接 的检索,用户在检索中遇到的不清楚的问题,如对机构、人物背景信息的不熟悉,可以通 过直接面对

28、面的现场咨询或直接调阅档案材料就可解决,所以,在传统档案检索工具中档 案索引的结构都是比较简单的,而且在档案馆的检索体系中不占据主导地位。但是,在计 算机网络环境下,用户进行的档案检索是异地的、远程的、非面对面的检索。这时,用户 在检索中遇到的不清楚的问题,如对机构、人物背景信息的不熟悉,就无法通过面对面的 直接咨询或调阅档案材料来解决。由此可见,在计算机网络环境下,用户要获取背景信息 就得直接依赖于检索系统,而此时如果检索系统不提供专名索引,用户就无法获得这些信 息,那么用户在检索中就会受挫,检索系统的检索效率就会受到极大的制约。在这样的检 索条件下,要想有效地、科学地开发档案信息资源是很难

29、做到的。所以,在计算机网络环 境下建立起功能强大的索引不仅是为用户检索档案提供方便性的措施,而且更重要的是, 这是使档案信息资源得到科学有效开发的关键性措施。 2档案检索系统建立专名索引要标准、规范先行 在档案检索系统中建立专名索引,从计算机的角度来讲,不存在什么技术难题,但是 要对一个检索系统中的几十万条、几百万条乃至几千万条数据建立起规则有序的专名索引, 这在没有标准与规范的情况下,是难以建成的。这恐怕也就是我国目前档案计算机检索系 统中缺乏专名索引建立的重要原因。这从一个侧面告诉我们,建立档案检索系统的专名索 引,不是想建就能建成的,它需要标准与规范,而目前在我国档案领域尚无这方面的标准

30、 与规范。档案的信息化要以标准化为基础,没有档案的标准化就没有信息化,这已为实践 所证明。人人 名:名: 乔布乔布肯瑞德肯瑞德 条目出处:条目出处: 以主题词形式出现在以主题词形式出现在 1010 个条目中个条目中 人物生平:人物生平: 18761876 年生于德国科隆,年生于德国科隆,1949-19631949-1963 年之间,任年之间,任 联邦德国(西德)政府大臣,卒于联邦德国(西德)政府大臣,卒于 19671967 年。年。 多种称谓:多种称谓: 乔乔肯瑞德肯瑞德约翰约翰肯瑞德肯瑞德链链 接接3加强培养档案信息化的复合型人才 在档案检索系统中建立专名索引,其本质也是实现档案信息化的一种措施,影响档案 信息化建设的方方面面的因素很多,但是,不能否认人才是其中最关键性的因素之一。当 前档案界面临着从传统手工环境向计算机数字环境的转换,这一方面需要我们的档案工作 者既熟悉传统手工环境下的档案检索的好的经验与作法,加以继承与发展,另一方面又需 要我们档案工作者探索与研究在计算机环境下的档案信息化的最佳实践方案,这些都在呼 唤着档案工作者要成为复合型的人才。所以,从这个意义上讲,培养复合型人才显得更为 迫切。当然,培养可以有各种途径,如自我知识更新,继续教育,学校教育等等,唯有如 此,才能使我们信息化建设包括专名索引的建立得以顺利的实现。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 教育教学

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com