大数据从悄然崛起到万众瞩目,已经成为现代社会的重要组成部分,数据价值已被国家正式认可。档案作为社会发展和历史变迁的见证,蕴藏着丰富的数据资源,是大数据的主要数据来源之一。与互联网数据资源、社会数据资源等数据资源相比,档案数据资源是一种真实、可靠和具有权威性和凭证性的原生信息资源,这使得档案数据资源的重要性更加凸显。在大数据时代背景下,如何加强档案数据资源建设,充分挖掘档案数据的潜在价值,是每一位档案工作者需要思考的理论和实践问题。
档案数据资源建设是指在信息化背景下,运用现代信息技术和方法,对档案数据进行采集、加工、存储、开发利用等全生命周期的管理过程。当前,由于档案资源来源广泛、形式多样,其收集、加工和转化能力不足,使得档案数据资源得不到有效的开发和利用,难以充分发挥其社会效益。因此,档案数据资源的整合、管理、挖掘、共享是强化档案数据资源建设的重点和关键。
一档案数据资源整合
档案数据资源整合是将分散的档案资料进行整合,统一管理。由于档案来源不一,各单位管理制度、技术水平、观念不同,档案资源呈现碎片化的特点,使得档案数据整合会出现数据不完整、重复、错误等问题。
要解决档案数据整合难题,一方面要加强顶层设计,建立统一的整合规范标准,统一的档案数据信息资源管理体系,另一方面,要加强技术创新,将传统的档案管理模式与现代信息技术相结合,如结合单位实际,将云计算、大数据、区块链等技术融入到档案管理软件中,提高数据收集的完整性、安全性、稳定性,为档案数据资源的整合提供更好的支持。
二档案数据资源管理
大数据时代,数据信息资源变得更加开放,这对档案数据信息资源安全构成了很大的威胁,例如黑客的非法入侵、电脑病毒等都会导致档案数据的篡改、窃取、损毁、遗失。这除了需要完善的基础设施建设,更需要全力构建软件先进、硬件完备、安全保密的档案数据资源容灾备份中心,从制度上、技术上、管理上确保档案数据的安全存储、长期可读、有效利用。
三档案数据资源挖掘
档案数据资源挖掘是指利用信息技术和数据分析方法,从海量的档案数据中发现隐藏在其中的规律和价值,提取有价值的信息和知识的过程。通过对档案数据资源的挖掘和分析,可以深入了解社会各界对档案信息的需求和用户行为习惯,为政府决策、企业发展等提供有力的数据支持,从而提供更加精准的信息服务。
档案数据资源挖掘应该针对档案资源进行重点研究分析,这不仅需要档案工作者有大数据思维、创新思维还需要懂点数据挖掘技术,包括关联规则挖掘、聚类分析、决策树分析和可视化技术、文本挖掘技术、自然语言处理技术等,特别随着人工智能、大数据等技术的不断发展,档案数据挖掘更需要利用机器学习算法进行数据分类和预测,提高挖掘的准确性和效率,这需要加强创新型人才和技术型人才的培养和引进力度,建立一支既懂档案管理又懂信息技术的专业人才队伍。
四档案数据资源共享
便于社会各方面对档案的利用是档案工作的最终目的。档案数据资源共享不仅可以提高档案利用效率,为用户提供个性化的档案信息服务,拓宽服务渠道,还可以通过线上线下相结合的方式提供全方位的服务支持。档案数据资源共享是档案数据资源建设的关键和目标。
要推进档案数据资源共享,首先,制定相关法规政策,为档案数据资源共享提供法规依据。《档案法》第四十一条明确规定“国家推进档案信息资源共享服务平台建设,推动档案数字资源跨区域、跨部门共享利用”、《“十四五”全国档案事业发展规划》第19条明确指出“推进档案信息资源共享平台建设”都为档案数据资源共享提供了法律保障和政策指导。
其次,在实践层面,可以通过引入先进的技术手段和档案管理理念建立档案数据资源共享平台,使不同部门、机构、地区之间的档案信息得以互通有无,打破信息壁垒,实现资源共享,推动不同机构、部门、地区之间的信息共享和协同工作。
最后,档案数据资源共享也面临诸多挑战,其中,隐私数据泄露和数据产权归属问题尤为突出。这需要进一步完善相关法律法规,例如,明确档案数据资源的所有权、使用权和收益权等,为共享过程中的权益保护提供法律支持,同时加强数据治理,提高档案数据资源的质量和可用性,并通过加强用户身份认证、数据加密传输等方面的技术保障建立信任体系,确保共享过程中的数据安全和隐私保护。
《“十四五”全国档案事业发展规划》提出,到2035年,档案资源建设质量、档案利用服务水平、档案治理效能和管理现代化程度进入世界前列。在大数据时代背景下,档案数据资源是档案资源的本质和核心,是档案资源的具体内容,是组织、政府和社会的重要资产,具有不可替代的价值。加强档案数据资源建设对于推动社会发展、提高政府决策水平、促进学术研究等方面具有重要意义。