英国政府网站档案馆对我国数字档案馆建设的启示
来源:网络 时间:2022-03-19
一、英国政府网站档案馆的建设背景
网络信息资源飞速增长,人们越来越依赖从网上获取信息资源。政府与公众之间的互动交流也大多数发生在网上。网络往往是公众向政治家、公务员、商界和专业团体提出要求的首要途径。网站中有效记录了公众和政府之间互动的变化过程,并能够提供相关的背景信息。然而,网络信息的经常更新,网站缺乏统一有效地管理,使得大量有价值的信息资源丢失。
为了保存英国中央政府网站中丰富的信息资源,英国国家档案馆于2003年9月建立了英国政府网站档案馆(UK Government Web Archives,UKGWA),通过将英国中央政府的网站归档保存,实现对其中丰富信息资源的保存。[1]
二、英国政府网站档案馆的特点
(一)明确清晰的收藏范围和捕获方式[2]
英国国家档案馆负责的政府网站档案馆(UKG? WA)中,只归档所有的英国中央政府网站,包括所有的中央政府部门网站、政府机构和非政府部门的公共机构网站、公共咨询和皇家委员会网站、重要的国家医疗服务体系网站以及区域发展机构网站。并且给出了一份选定需要归档的网站的详细列表,网站管理员和中央政府部门的文件档案工作人员可以查看该列表。
大多数网站是每年拍取两到三次快照,如果有需要反映的重大事件,有时也会提高拍照的频率。列表中排在前十位的网站每个月会进行一次网络爬虫。内阁部门和非内阁部门的网站每年进行三次网络爬虫。属于被审查网站范围内的机关和公共机构的网站每年进行两次爬虫。不在审查范围内的网站每年进行两次网络爬虫或者因为归档原因只爬虫一次,取决于国家档案馆的评估和选择。一些社交媒体网站,每八个月进行一次网络爬虫。
早期,国家档案馆的网站归档项目中主要捕获一些网站中的基本功能、导航、外观等。且由于远程捕获网站技术的局限性,早期的归档软件往往也只捕获网站的顶级网页,一般不包括图像等。随着网站归档工具的完善以及方法的重新评估,虽然仍无法保证捕获网站的所有层级中的所有文件,但是目前国家档案馆已经能够尽可能完整地对网站进行捕获。
(二)多样化的馆藏资源语种
英国政府网站档案馆中的网站资源大多数是以英语和威尔士语言呈现,但也有大量其他语言形式。多语种馆藏内容有利于更多用户利用资源。这些网站信息的创建目的也和非数字信息一样的多种多样。包括展示英国文化的多元性、通过信息传播提高公众的参与度等等。通过对不同语种信息内容类型的简要分析,总结出以下一些类型[3]:
(三)时间维度的馆藏资源展示方式
英国国家档案馆一直致力于寻求更新、更好的政府网站档案馆馆藏资源提供利用的方式。到目前为止,最具创新性、最令人激动的改善是“备忘录”的引入。备忘录(Memento)是一种工具,最初是由美国洛斯阿拉莫斯国家实验室的研究人员开发,现在越来越多的网站开始使用这一工具。[4]备忘录旨在网站中添加一个时间维度,可以让用户查看特定历史时刻下,网站资源的某一版本,这些资源包括网页、文档、数据等。需要注意的是,用户使用备忘录,需要安装火狐浏览器以及Me? mentoFox附加软件后,用户就可以按照相关说明使用英国网站档案馆中的备忘录工具。用户在地址栏中,输入想要查看的资源地址之后,就可以通过滑动滚动条或者调整日期栏中的日期,按照时间查看网站资源。
(四)完善的检索和浏览功能
英国网站档案馆不仅提供简单检索和高级检索功能,还提供主题馆藏(Themed collec? tion)、特色网站、A-Z浏览、主题浏览、归档数据集、视频档案、推特档案(Twitter archive)等资源分类浏览服务[5]。
其中,主题浏览方式,共分为12类主题[6],见表2。主题馆藏则主要是反映给国家或政府带来重大影响的某一特定历史时期、某些重大事件或一些公众比较感兴趣的问题。如,网站中展示了包括“2012年奥运会和残奥会”“2008年经济危机”在内的17个主题馆藏。[7]
此外,网站界面右方还有一个“Popular”标签,点击这个标签,用户可以浏览一段时间内最受欢迎的归档网站,极大地方便了用户获取知识的各种需求。
(五)馆藏资源的高利用率
英国政府网站档案馆目前已经保存了超过35亿个网址。用户除了可以直接访问档案馆网站利用馆藏资源外,档案馆还设置了相关跳转功能。即如果一个用户查找的网站目前已经不存在,而政府网站档案馆中保存有该网站,那么用户就会自动被引入(redirected)英国政府网站档案馆。而且,归档网页的顶部会有英国国家档案馆的红色Logo标志,从而将归档网页与现行网页(live site)区分开来。防止用户错误利用过时信息,带来不良影响。
国家档案馆记录UKGWA的网络流量来反映用户对政府网站档案馆的利用情况。该流量统计包括跳转流量和浏览量。自从,开始记录网站档案馆的网络流量以来,已经有超过17亿次到该网站的跳转记录。2012-2013年,跳转过来的点击量是441,417,367次[8]下表是从档案馆网站中获得的英国政府网站档案馆的总点击量(包括跳转流量和浏览量)近几年的月度明细。[9]统计单位为百万次。 表3英国政府网站档案馆(2010.4―2013.11)总点击量的月度明细表
(六)重视解决知识产权问题
政府网站中档案馆的网站管理员负责其网站内的法律问题,包括遵从数据保护和版权方面的法律。英国政府网站档案馆中保存的网站中并不都是由皇家机构创建,因而也并不是所有的都具有皇家版权。一般情况下,按照政务公开许可(Open Government Li? cence)用户可以免费利用从UKGWA中获取的拥有皇家版权的馆藏资源。
但是,如果一个网站中包含第三方机构版权的信息内容,国家档案馆需要提供相应证据证明拥有版权的第三方机构已经授予国家档案馆或网站所有者相应版权,允许将这些信息在网上公开之后,才能予以公开。且这些资源的版权状态应当清楚的在网站中说明,或者对资源本身进行标注。如果版权所有者没有授予相关权限,国家档案馆就不能够将这些信息在网站档案馆中提供利用。[10]
三、英国政府网站档案馆给我国的启示
他山之石,可以攻玉。英国政府网站档案馆,通过将英国中央政府的网站以及一些社交媒体上的文件归档,保护了大量反映政府和公众互动过程中的重要信息资源,对开放、透明政府的建设以及英国国家档案馆发挥其重要使命和价值具有至关重要的作用。英国政府网站档案馆的建设经验和特点,值得我国在建设类似数字档案馆过程中借鉴和参考。
(一)档案馆功能定位明确
英国国家档案馆着手建立英国政府网站档案馆的定位就是归档保存英国中央政府网站,进而长期保存网站中包含的具有重要价值的信息资源,维护对国家具有重大意义的网络信息资产。政府网站档案馆只归档保存包括中央政府部门、政府机构和非政府部门的公共机构、公共咨询和皇家委员会、重要的国家医疗服务体系以及区域发展机构等中央政府的网站。而对于更大范围网站的归档则由其他收集机构负责。比如,苏格兰国家图书馆和威尔士国家图书馆主要捕获地方自治政府的网站;英国国家图书馆则主要捕获有关国家文化遗产的网站。
明确、单一的职能定位,可以保证政府网站档案馆更加充分、深入地发挥其功能和作用,有效地保存重要信息资产,更好地服务于国家和社会公众。近年来,我国政府信息公开越来越成熟,各级政府网站上都公布了大量重要信息,很多信息甚至是直接产生于网站中。我国也可以像英国国家档案馆负责政府网站的保存模式,明确由中央档案馆来负责我国各级政府网站的保存。而国家图书馆、国家博物馆则负责其他有关国家文化遗产等网站的保存。
(二)服务方式多样化
英国政府网站档案馆为了尽可能好的服务于用户、满足用户的多样化需求,提供了多种多样的服务方式。既包括多种形式的利用渠道,也包括其他多样化的馆藏资源展示方式。具体体现在以下几个方面:1.用户可以通过简单检索和高级检索等查询馆藏资源。2.在没有特定查找目标的情况下,用户可以通过A-Z浏览,以及主题浏览的方式,随意查看,并在浏览的过程中,找到自己感兴趣的资源。3.Popular标签,可以方便用户迅速了解目前的热点搜索。而主题馆藏则系统的向用户展示有关特定重大事件的所有相关资源,全面、快速地找到档案馆中某一主题的所有资源。4.多种语言类型的馆藏资源,克服了一定的语言障碍,方便更多的用户利用,自然也扩大了档案馆潜在用户的范围。5.用户不仅可以通过UKGWA的网站利用馆藏资源,档案馆还提供“跳转”利用方式,即当用户查找的网页当前已经不存在时,相应系统就会自动跳转到UKGWA中归档保存的网页,提供用户利用。
总之,多管齐下,多种多样的服务方式,在提高用户满意度的同时,也不可避免地提高了对存储资源的利用率,这对我国档案馆服务功能的完善以及网站存储项目都具有重要启示。如,我国2002年1月18日启动了“中国Web信息博物馆”(WebInfoMall)[11]建设,致力于有效保存中国互联网上曾经出现过的历史信息,为大众提供中国历史网页浏览服务,成为我国大型的信息资源库。WebInfoMall是我国唯一系统进行的海量历史网页信息保存项目,其网站系统只提供网页回放、时间搜索、数据分享等功能。相比UKGWA来说,虽然WebInfoMall存储了更多的有价值信息资源,但其提供利用的服务方式稍显薄弱,这也就影响了其重要价值的发挥。
(三)档案馆注重联合建设
英国国家档案馆意识到越来越多政府网站上有价值的重要信息面临丢失的风险,为了解决这一问题,2003年,开始了网站归档项目,建立英国政府网站档案馆。当时与网络档案馆(Internet Archive)(美国的一个非营利组织,1996年就开始归档保存来自世界各地的网站)合作,共同完成政府网站归档工作,且主要有选择的归档保存大约50个政府网站。值得注意的是,网络档案馆(IA)保存的网站中包括一些1997年以前英国中央政府的网站,通过与IA签订合同后,现在这些网站可以通过UKG? WA提供利用。[12]
2005年起,开始与互联网记忆基金会(the Internet Memory Foundation,前身为the European Archive)合作进行网站归档工作。该基金会是一个以“为研究人员、历史学家和学者创建网络图书馆”为目的而成立的非盈利性网站归档专业机构。[13]
2004到2009年之间,还与英国网站保存联盟(UK? WAC)合作,英国国家档案馆也是UKWAC的创始成员之一。2009年英国网站保存联盟解体。2010年之后,国家档案馆开始于UKWAC的继任组织――网站归档和保存工作小组(The Web Archiving and Preservation Task Force)合作,开展政府网站归档工作。[14] 不同时期,注重和不同组织的合作,共同开展网站归档工作,充分利用对方的优势,更好地发挥政府网站档案馆的功能和价值。这也是我国档案馆开展项目工作过程中,值得学习和正在努力发展的方向。
(四)利用行为法制化
英国政府网站档案馆在运行过程中,非常重视解决知识产权等法律问题。不仅在采集资源的过程中,防止各种可能的侵权行为,提供利用时,更是严格遵从相关法规要求。对于涉及第三方机构版权的网站,国家档案馆必须在获得版权所有者授予相关权限的基础上,才能够将这些信息在政府网站档案馆中提供利用。且这些资源的版权状态应当清楚的在网站中说明,或者对资源本身进行标注。
在我国,网络信息同样受到著作权法的保护。我们进行网站等网络信息归档保存项目时,英国政府网站档案馆对网络内容版权的处理方式值得借鉴。