
关注我们 - 数字罗塞塔计划 -
在面对日益增长的数字内容量和不断变化的技术环境时,长期可持续的数字保存已成为信息资源管理领域的核心议题。Open Preservation Foundation(OPF,开放保存基金会)作为国际领先的开源数字保存组织,致力于为档案馆、图书馆、博物馆及其他长期保存机构提供可信赖的工具、标准与支持。通过推动开源解决方案的发展与社区合作,OPF正在帮助全球机构应对数字信息生命周期管理中的挑战,提升数字资产的可获取性与完整性,确保其跨平台、跨世代的可持续访问。
一、组织概况
OPF是一个全球性的非营利会员制组织,致力于为长期数字内容的保存和访问提供开源软件、标准与最佳实践。
OPF最初名为Open Planets Foundation,源自欧盟资助的PLANETS 项目成果的延续。PLANETS项目于2006年启动,旨在开发一系列数字保存服务与工具,产出了包括格式识别、验证与迁移等方面的成果,该项目在取得阶段性成果之后已于2010年结束(项目更多内容见公众号文章《数字资源长期保存国际项目巡礼(五):PLANETS》)。为延续PLANETS项目的成果,2010年6月1日,Open Planets Foundation正式在英国注册成立,首批成员包括欧洲多个国家的国家档案馆、图书馆、高校及企业。
展开剩余88%随着项目成果逐渐走向全球、应用场景日益多元,OPF组织于2014年正式更名为“Open Preservation Foundation”,以凸显其在数字保存领域的专业定位和国际化发展愿景。
二、核心工具与技术
OPF维护并推动了一系列关键的开源数字保存工具,这些工具在格式识别、验证和特征提取等方面发挥着重要作用。主要工具包括:
01 JHOVE:
全称JSTOR/Harvard Object Validation Environment,是一个用于数字文件格式的识别、验证和特征提取的开源框架。JHOVE采用可扩展的插件式架构,支持多种常见格式(例如PDF、JPEG、TIFF、XML等)的验证和特性分析。
02 veraPDF:
一个专门针对PDF/A标准的开源验证器,覆盖所有PDF/A(ISO 19005)和PDF/UA(ISO 14289)的功能要求。该项目由OPF与PDF协会联合领导,目的是为数字保存实践者提供一个功能完备的PDF/A验证工具。veraPDF能检测PDF文档是否符合标准规范,并在命令行或图形界面模式下生成详细报告。项目在欧盟PREFORMA项目的资助下,成功实现了对PDF/A各部分的全面验证。
03 Jpylyzer:
针对JPEG 2000静态图像格式的开源验证和特征提取工具。Jpylyzer可以检查JPEG 2000图像是否符合ISO/IEC 15444-1标准,并提取图像的技术属性(如分辨率、色彩空间、通道数等)。该工具常被用于数字图像长期保存流程的格式认证环节。
04 FIDO:
全称Format Identification for Digital Objects(数字对象的格式识别),由OPF维护的开源Python命令行工具,用于识别数字对象的文件格式。FIDO主要借助英国国家档案馆提供的PRONOM文件格式签名库进行匹配,可识别各种文件的格式并报告相应的PRONOM PUID。它设计简洁、易于集成,可在自动化工作流程中批量执行格式识别任务。FIDO支持递归扫描目录、ZIP/TAR容器等功能,是数字档案馆中广泛使用的工具之一。
05 ViPER:
全称Virtual Preservation Environment for Research,是一个开源、易于安装的虚拟机,由OPF与荷兰国家档案馆(NA)合作开发。NA负责功能管理,OPF负责技术管理和可用性。它主要用于验证数字文件在迁移或转换过程中的语义保真性,是数字长期保存中质量控制环节的关键组件。例如,在文本转换中,确保OCR后的PDF与原始扫描图像图文一致;在数字图像保存中,比较TIFF和JPEG2000的图像是否在像素层面无损等。
以上工具共同构成了OPF参考工具集(OPF Reference Toolset)的核心。OPF定期为这些工具发布更新、修复错误,并通过文档、培训帮助用户有效应用这些工具。在运营实践中,这些工具已被全球多家机构采用,成为数字保存技术基础设施的重要组成部分。
三、社区活动与合作项目
01 网络研讨与培训交流
(1)每月网络研讨会(Webinars)
核心社区活动之一,为数字保存领域的专业人士、研究者和爱好者提供持续、免费的知识交流与培训平台。OPF自2012年起便开始举办网络研讨会,自推出时即宣布将按月举办,公开面向所有人,主题覆盖数字保存的各个方面,包括格式风险、工作流程、工具实操、存档策略等。
网络研讨会部分会议内容存档
(2)档案兴趣小组(Archive Interest Groups)
由OPF的三名档案成员于2016年成立,旨在合作应对共同的日常挑战,促进知识分享和技术协同。各兴趣小组在OPF官网的“成员区域”发布会议纪要、技术讨论文档,并定期举办线上讨论、专题研讨会等活动,帮助会员机构快速解决技术难题、推动工具新功能开发与集成。
(3)在线学习资源
在OPF网站的“资源”版块,提供包括年度报告、白皮书、技术指南、流程模板、实施案例等在内的丰富资料,并不断更新。会员可下载和转载(需注明来源),用于内部培训和项目规划。
02 应用案例与项目合作
(1)电子表格保存项目
(Spreadsheets Preservation Project)
丹麦、荷兰、爱沙尼亚国家档案馆共同与OPF建立国际合作,目标是开发用于电子表格(OOXML、ODF、CSV等)验证和识别保留风险的新规范与工具。他们联合研究有效技术方案及标准化流程,以确保文件即使在多年后也可被可靠读取与利用。其中,丹麦国家档案馆带头定义文件格式政策与软件规格,OPF则主导技术实现与开源发布。
(2)通过JISC与英国多所高校技术合作
2010年,JISC(英国联合信息系统委员会)作为发起成员加入OPF,开启了OPF与英国多所高校在数字保存方面的教学与研究合作。JISC牵头协调英国多所大学图书馆、信息学院参与多项OPF的开源项目,为OPF提供测试环境和研究课题,学生或科研人员则可基于这些项目开展插件开发、性能优化、互操作性研究等。
JISC加入OPF,旨在引导高校界关注数字保存问题,推动科研与课程开发,将前沿开源工具以及相关标准纳入教学。OPF则借助JISC,将其开源工具、最佳实践推广到更多大学。
四、战略规划
2024年12月6日,OPF发布了2024-2027年战略规划,为组织的未来发展指明了方向。新战略规划明确了OPF在数字保存领域的定位,将指导OPF未来开展的各项任务、工具及项目。其在2024-2027年期间将重点关注以下几个方面:
01 工具与参考工作流程
(1)核心目标:
对参考工具集中的工具进行监控和补充。
(2)关键举措:
· 整合工具集,提供统一用户界面,简化第三方集成。
· 减少冗余代码,降低维护成本,确保工具长期可持续性。
· 建立工具使用统计与反馈机制,优化开发路线图。
02 知识共享
(1)核心目标:
构建开放知识生态,促进全球协作。
(2)关键举措:
· 持续运营网络研讨会和兴趣小组,主题由会员主导,覆盖全球。
· 维护博客、维基知识库等社区资源,并提供托管服务。
· 新增会员专属资源板块,提升会员价值。
03 培训与“诊所”
(1)核心目标:
提升用户能力,扩大工具影响力。
(2)关键举措:
· 提供在线课程、现场研讨会、定制化内训等多层级培训;开设技术“诊所”(解决工具实操问题)与交流“诊所”(如政策制定)。
· 通过用户反馈优化工具文档和培训设计。
04 社区参与
(1)核心目标:
深化会员驱动模式,扩展全球参与。
(2)关键举措:
· 开源工作组协作:引导开发者贡献代码,教育开源理念。
· 拓展会员地域/领域(重点瞄准大学、新兴地区机构)。
05 品牌营销
(1)核心目标:
建立品牌意识,强化OPF行业领导力。
(2)关键举措:
· 提升工具包使用率。
· 将OPF定位为数字保存领域的领导者,展示OPF在政府思想和战略制定方面的影响力。
五、结 语
OPF自2010年成立以来,凭借开放源码与全球协作的理念,已成为数字保存领域的重要推动者。通过维护一系列成熟的开源工具、构建活跃的技术社区、举办丰富的培训与研讨活动,OPF有效降低了各机构开展数字保存工作的技术门槛,促进了行业最佳实践的普及。无论是国家级档案馆、科研图书馆,还是企业数字化部门,都可通过加入OPF,获得最新工具、最佳实践和行业网络的支持,共同应对数字保存领域的机遇与挑战,助力人类数字文明的可持续传承。
数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!
关注我们 - 数字罗塞塔计划 -
发布于:上海市申宝配资提示:文章来自网络,不代表本站观点。