Please wait a minute...
档案学研究  2025, Vol. 39 Issue (2): 121-129    DOI: 10.16065/j.cnki.issn1002-1620.2025.02.014
  档案信息化 本期目录 | 过刊浏览 |
建构与解构:生命周期视角下的档案数据质量控制探析
林凯1,周林兴2
1 苏州城市学院城市治理与公共事务学院 苏州 215104
2 上海大学文化遗产与信息管理学院 上海 200444
Construction and Deconstruction: Analysis of Archival Data Quality Control from the Perspective of Life Cycle
Kai LIN1,Linxing ZHOU2
1 School of Urban Governance and Public Affairs of Suzhou City University, Suzhou 215104
2 School of Cultural Heritage and Information Management, Shanghai University, Shanghai 200444
全文: HTML    PDF(1279 KB)  
输出: BibTeX | EndNote (RIS)      
摘要: 

大数据时代,档案数据迅速增长、难以管控,数据质量问题严重限制了档案数据价值的发挥,开展档案数据质量控制研究具有重要意义。通过系统梳理有关文献,阐述档案数据质量控制的出场逻辑,借鉴生命周期理论,将档案数据生命周期过程划分为数据生成、数据收集、数据组织与分析、数据归档与保存、数据发布与利用五个环节,并立足于档案数据生命周期,将档案数据质量控制过程建构为前端、中端、后端三个阶段,再对每一阶段的质量控制过程进行解构,以期为提升档案数据质量提供有价值的研究参考。

关键词 生命周期档案数据数据质量质量控制质量优化    
Abstract

In the era of big data, archival data has grown rapidly and is difficult to control. Data quality problems have seriously limited the value of archival data, so it is of great significance to carry out research on archival data quality control. Systematically reviewing relevant literature, this paper elaborates on the logic of quality control for archival data and, drawing on the life cycle theory, divides the process of archival data life cycle into five stages: data generation, data collection, data organization and analysis, data archiving and preservation, and data release and utilization. Based on the lifecycle process of archival data, the quality control of archival data is constructed into three stages: front-end, mid-end, and back-end. The quality control process of each stage is deconstructed to provide valuable research references for improving the quality of archival data.

Key wordslife cycle    archival data    data quality    quality control    quality optimization
出版日期: 2025-04-28
通讯作者: 周林兴   
引用本文:

林凯, 周林兴. 建构与解构:生命周期视角下的档案数据质量控制探析[J]. 档案学研究, 2025, 39(2): 121-129.
Kai LIN, Linxing ZHOU. Construction and Deconstruction: Analysis of Archival Data Quality Control from the Perspective of Life Cycle. Archives Science Study, 2025, 39(2): 121-129.

链接本文:

https://journal12.magtechjournal.com/Jwk_dax/CN/10.16065/j.cnki.issn1002-1620.2025.02.014      或      https://journal12.magtechjournal.com/Jwk_dax/CN/Y2025/V39/I2/121

[1] [25] 国家档案局. 中办国办印发《“十四五”全国档案事业发展规划》[EB/OL].[2023-01-12]. https://www.saac.gov.cn/daj/yaow/202106/899650c1b1ec4c0e9ad3c2ca7310eca4.shtml.
[2] 国家档案局. 在全国档案局长馆长会议上的报告[EB/OL].[2023-01-12]. https://www.saac.gov.cn/daj/yaow/202203/5b5257a20b964995b22afc1d585382b1.shtml.
[3] 杨太阳. 把握科技脉动探索管理创新—第八届中国电子文件管理论坛在京召开[N]. 中国档案报, 2017-12-18(1).
[4] [23] 金波, 添志鹏. 档案数据内涵与特征探析[J]. 档案学通讯, 2020(3):4-11.
[5] 杜彦峰, 相丽玲, 李文龙. 大数据背景下信息生命周期理论的再思考[J]. 情报理论与实践, 2015(5):25-29.
[6] [17] 金波, 杨鹏. 大数据时代档案数据治理研究[J]. 档案学研究, 2020(4):29-37.
[7] 陈慧, 罗慧玉, 陈晖. 档案数据质量要素识别及智能化保障探究—以昆柳龙直流工程项目档案为例[J]. 档案学通讯, 2021(5):49-57.
[8] 周林兴, 崔云萍. 大数据视域下档案数据质量控制实现路径探析[J]. 档案学通讯, 2022(3):39-47.
[9] 周林兴, 林凯. 大数据时代档案数据质量控制:现状、机制与优化路径[J]. 档案与建设, 2022(2):4-8.
[10] 周林兴, 黄星. 大数据时代档案数据开放共享监管:价值、机制与推进理路[J]. 档案与建设, 2023(8):6-10.
[11] 葛泽钰. 基于PDCA循环的档案数据质量控制探究[J]. 档案与建设, 2023(8):40-43.
[12] 刘越男. 数据治理:大数据时代档案管理的新视角和新职能[J]. 档案学研究, 2020(5):50-57.
[13] 周林兴, 黄星. 大数据时代档案数据开放共享机制探析[J]. 档案与建设, 2023(3):8-12.
[14] LEMIEUX V L. Trusting records: is Blockchain technology the answer?[J]. Records Management Journal, 2016(2):110-139.
[15] 何玉颜. 档案部门参与政府大数据治理的路径研究[J]. 浙江档案, 2018(8):23-25.
[16] DIMAKIS A G, GODFREY P B, WU Y, et al. Net work coding for distributed storage systems[J]. IEEE transactions on information theory, 2010(9):4539-4551.
[18] 国家档案局政策法规司. 2023年度全国档案主管部门和档案馆基本情况摘要(二)[EB/OL].[2024-12-27]. https://www.saac.gov.cn/daj/zhdt/202409/a277f8b3bfe942ca88d3b7bcf6ddf120.shtml.
[19] [35] 钱毅. 数据态环境中数字档案对象保存问题与策略分析[J]. 档案学通讯, 2019(4):40-47.
[20] 周国刚. 浙江绍兴“树牢档案数字化思维”[EB/OL].[2023-05-04]. http://www.zgdazxw.com.cn/news/2021-09/07/content_325016.html.
[21] [22] 杨鹏. 大数据时代档案数据权利及其体系构建[J]. 档案学通讯, 2022(4):51-57.
[24] 朝乐门, 邢春晓, 张勇. 数据科学研究的现状与趋势[J]. 计算机科学, 2018(1):1-13.
[26] 刘德寰, 李雪莲. 数据生态的危险趋势与数据科学的可能空间—兼谈中国市场调查业的现状与问题[J]. 现代传播(中国传媒大学学报), 2016(1):21-27.
[27] 江跃中, 方翔, 潘高峰. 上海居民电子健康档案数据质量堪忧委员建议制定电子健康档案建设应用规范[EB/OL].[2023-05-04]. https://baijiahao.baidu.com/s?id=1655847991850559992&wfr=spider&for=pc.
[28] 金波, 晏秦. 数据管理与档案信息服务创新[J]. 档案学研究, 2017(6):99-104.
[29] 大数据战略重点实验室. 块数据2.0:大数据时代的范式革命[M]. 北京: 中信出版社, 2016:71.
[30] 王向女, 袁倩. 美梦还是陷阱?—论数据科学背景下的档案数据管理[J]. 档案与建设, 2019(9):4-7,12.
[31] 赵跃. 大数据时代档案数据化的前景展望:意义与困境[J]. 档案学研究, 2019(5):52-60.
[32] CORTI L, EYNDEN V V D, WOOLLARD M, et al. Managing and sharing research data: a guide to good practice[J]. Records Management Journal, 2014(3):252-253.
[33] 武彤. 基于数据生命周期的美国研究图书馆科学数据开放共享服务研究[J]. 图书与情报, 2019(1):135-144.
[34] 黄霄羽. 文件生命周期理论对机关文档管理的启示[J]. 档案学通讯, 2003(5):65-69.
[36] 金波, 陈坚, 李佳男, 等. 大数据时代档案数据资源整合探究[J]. 档案与建设, 2022(9):18-23.
[37] 白文琳, 安小米. 政府电子文件协同管理:美国经验及其启示[J]. 档案学通讯, 2020(4):103-112.
[38] 于英香, 刘茜. 论计算档案学的出场逻辑[J]. 档案学通讯, 2021(5):22-31.
[39] 杨建梁, 刘越男. 机器学习在档案管理中的应用:进展与挑战[J]. 档案学通讯, 2019(6):48-56.
[40] 张洋, 肖燕珠. 生命周期视角下《科学数据管理办法》解读及其启示[J]. 图书馆学研究, 2019(15):37-43,13.
[41] CSIRO. Introduction to research data management[EB/OL].[2023-01-22]. http://libguides.csrio.au/ResearchDataManagement.
[42] 王志宇, 熊华兰. 语义网环境下数字档案资源关联与共享模式研究[J]. 档案学研究, 2019(5):114-119.
[43] 牛力, 曾静怡, 刘丁君. 数字记忆视角下档案创新开发利用“PDU”模型探析[J]. 档案学通讯, 2019(1):65-72.
[44] [47] 杨文娜. 大数据环境下归档政务信息长期保存研究[J]. 档案学通讯, 2022(1):109-112.
[45] 高闯, 柳林集. 合规与妥协:空客德国产品数据归档的现状及其启示[J]. 档案学研究, 2021(2):119-124.
[46] 钱毅. 新技术环境下电子文件管理纵深发展关键问题分析[J]. 档案学通讯, 2020(2):4-9.
[48] 杨茜雅. 中国联通电子档案数据挖掘与智能利用的研究[J]. 档案学研究, 2018(6):105-109.
[49] 赵君. 共建共享背景下地理信息档案安全系统建设实践[J]. 中国档案, 2022(10):62-63.
[1] 杨鹏,金波. 档案数据要素赋能新质生产力发展的“理”与“路”[J]. 档案学研究, 2025, 39(2): 4-12.
[2] 江媛媛, 孟祥保. 澳大利亚国家档案馆数据治理历程、特征及启示[J]. 档案学研究, 2025, 39(1): 139-148.
[3] 张宁, 唐欣越. 基于数据清理的企业档案数据质量控制研究[J]. 档案学研究, 2024, 38(6): 110-119.
[4] 李宗富, 姜爱玲. 档案数据治理的伦理审视:内蕴、风险与路径[J]. 档案学研究, 2024, 38(4): 4-11.
[5] 程结晶, 王璞钰. 全生命周期视域下口述历史档案元数据建设研究—基于OHA《口述历史元数据与描述》的解析[J]. 档案学研究, 2024, 38(4): 77-86.
[6] 吕元智. 面向多元化利用场景的档案资源数据化组织研究[J]. 档案学研究, 2024, 38(4): 68-76.
[7] 金波, 杨鹏. 档案数据治理赋能的思维意象与行动具象[J]. 档案学研究, 2024, 38(3): 4-12.
[8] 俞佳,江若飞. 大数据时代行业档案数据管理研究—以铁路档案数据为例[J]. 档案学研究, 2024, 38(3): 129-134.
[9] 赵生辉, 闵冬元. 数据态档案叙事:原理、方法与实证[J]. 档案学研究, 2024, 38(2): 116-125.
[10] 宋帆帆, 苏君华. 数智驱动下档案公共服务价值共创:价值、模式与路径[J]. 档案学研究, 2024, 38(2): 30-37.
[11] 赵丽, 陈建. 基于过程管理的历史档案资源众包框架与实施策略[J]. 档案学研究, 2024, 38(2): 63-71.
[12] 黄夏基,古琼梅. 文件生命周期理论在数字时代的生命力—从文件运动现象得到的思考[J]. 档案学研究, 2023, 37(6): 17-24.
[13] 孔维冲. 档案信息资源赋能数字军队建设[J]. 档案学研究, 2023, 37(6): 110-118.
[14] 陈永生, 任珊珊, 刘晓怡. 近代广东海关档案数据库建设需求与策略研究[J]. 档案学研究, 2023, 37(6): 93-101.
[15] 金波, 添志鹏, 杨鹏. 大数据时代档案数据治理运行机制建构[J]. 档案学研究, 2023, 37(4): 65-73.