Please wait a minute...
档案学研究  2025, Vol. 39 Issue (6): 132-140    DOI: 10.16065/j.cnki.issn1002-1620.2025.06.016
  档案信息化 本期目录 | 过刊浏览 |
基于自然语言处理技术的档案开放审核协同式智慧化路径探索研究
胡元潮1,何秋琴1,张梦怡1,叶亚芬2,刘志立2
1.浙江省档案馆 杭州 310000
2.上海泰宇信息技术股份有限公司 上海 201100
Research on the Exploration of Collaborative and Intelligent Path of Archive Opening Review Based on Natural Language Processing Technology
HU Yuanchao1,HE Qiuqin1,ZHANG Mengyi1,YE Yafen2,LIU Zhili2
1. Zhejiang Provincial Archives, Hangzhou 310000
2. Shanghai Taiyu Information Technology Co., Ltd., Shanghai 201100
全文: HTML    PDF(1523 KB)  
输出: BibTeX | EndNote (RIS)      
摘要: 

当前档案开放审核中存在职责不清、标准不统一及传统人工效率低下等问题,严重影响了开放审核进程。同时,大数据时代,档案数据激增,档案开放审核任务量达到了百万级别,如何有效应对档案开放审核工作中“存量积压多、增量增加快”的挑战,已成为当前档案管理工作中的核心议题。本文聚焦于此问题,探索了构建档案开放审核协同机制的路径,并通过研究对比当前各类信息技术的优劣势,提出了基于自然语言处理(NLP)技术的档案开放审核协同式智慧化路径,以期为档案开放审核协同化、智慧化发展提供参考。

关键词 档案开放审核协同机制NLP技术    
Abstract

Currently, there are problems in archive opening review such as unclear responsibilities, inconsistent standards, and low efficiency of traditional manual work, which seriously affect the progress of opening review. Meanwhile, in the era of big data, archive data has surged, and the number of archive opening review tasks has reached the million level. How to effectively address the challenges of "large backlog of existing records and rapid growth of new additions" in archive opening review has become a core issue in current archive management work. Focusing on this problem, this paper explores the path of constructing a collaborative mechanism for archive opening review, and by studying and comparing the advantages and disadvantages of various current information technologies, proposes an intelligent opening review technology implementation path based on Natural Language Processing (NLP) technology, aiming to provide a reference for the collaborative and intelligent development of archive opening review.

Key wordsarchive opening review    collaborative mechanism    NLP technology
出版日期: 2025-12-28
通讯作者: 张梦怡   
Corresponding author: Mengyi ZHANG   
引用本文:

胡元潮, 何秋琴, 张梦怡, 叶亚芬, 刘志立. 基于自然语言处理技术的档案开放审核协同式智慧化路径探索研究[J]. 档案学研究, 2025, 39(6): 132-140.
HU Yuanchao, HE Qiuqin, ZHANG Mengyi, YE Yafen, LIU Zhili. Research on the Exploration of Collaborative and Intelligent Path of Archive Opening Review Based on Natural Language Processing Technology. Archives Science Study, 2025, 39(6): 132-140.

链接本文:

https://journal12.magtechjournal.com/Jwk_dax/CN/10.16065/j.cnki.issn1002-1620.2025.06.016      或      https://journal12.magtechjournal.com/Jwk_dax/CN/Y2025/V39/I6/132

[1] 陆国强. 全面贯彻落实党的二十大精神奋力书写档案事业现代化和高质量发展新篇章—在全国档案局长馆长会议上的报告[EB/OL].[2025-8-21]. https://www.saac.gov.cn/daj/yaow/202302/edef53f544bb4eea8bfacd87fd8a223e.shtml.
[2] 黄建峰, 颜梓森, 张枫旻, 等. 运用人工智能技术搭建开放审核模型[J]. 中国档案, 2023(7):27-29.
[3] 卞咸杰. 档案开放智能审核中的敏感词识别与控制技术研究[J]. 档案管理, 2024(5):29-32.
[4] 刘越男, 张茜雅, 杨建梁. 大语言模型在档案开放审核中的应用框架与路径探究[J]. 档案学通讯, 2025(2):31-38.
[5] 闫静, 谢鹏鑫, 张臻. 新《档案法》背景下国家综合档案馆档案开放审核的挑战及对策[J]. 北京档案, 2022(7):7-10.
[6] 黄孟苏. 档案开放审核协同机制:理论阐释、制度困境与构建路径[J]. 档案学通讯, 2025(2):39-45.
[7] 肖秋会, 王玉, 张博闻. 档案开放审核自由裁量权控制机制研究[J]. 档案学研究, 2023(6):61-68.
[8] 黄新荣, 梁钰唯. 我国档案开放的制度完善及机制构建探究[J]. 档案与建设, 2022(6):9-12.
[9] 安徽省档案馆课题组. 人工智能技术在档案划控上的应用研究[J]. 中国档案, 2024(5):64-65.
[10] 李清格, 杨小冈, 卢瑞涛, 等. 计算机视觉中的Transformer发展综述[J]. 小型微型计算机系统, 2023(4):850-861.
[11] 胡春静, 韩兆强. 基于隐马尔可夫模型(HMM)的词性标注的应用研究[J]. 计算机工程与应用, 2002(6):62-64.
[12] 钟昕妤, 李燕. 中文分词技术研究进展综述[J]. 软件导刊, 2023(2):225-230.
[13] 梅侠峰, 吴晓钨, 黄泽民, 等. 融合RoBERTa的多尺度语义协同专利文本分类模型[J]. 计算机工程与科学, 2023(5):903-910.
[14] 袁里驰. 基于BiLSTM-CRF的中文分词和词性标注联合方法[J]. 中南大学学报(自然科学版), 2023(8):3145-3153.
[15] 阮光册, 周萌葳. 基于Sentence-BERT的专利技术主题聚类研究—以人工智能领域为例[J]. 情报杂志, 2024(2):110-117.
[16] DEVLIN J, CHANG M W, LEE K, et al. BERT: pre-training of deep bidirectional transformers for languageunderstanding[EB/OL].[2025-01-16]. https://arxiv.org/abs/1810.04805.
[17] YANG Z, DAI Z, YANG Y, et al. XLNet: generalized autoregressive pretraining for language understanding[J]. CoRR, 2019, abs/1906.08237.
[18] LIU Y, OTT M, GOYAL N, et al. RoBERTa: a robustly optimized bert pretraining approach[DB/OL].[2025-01-26]. https://doi.org/10.48550/arXiv.1907.11692.
[19] LI Q, PENG H, LI J, et al. A survey on text classification: from traditional to deep learning[J]. ACM Transactions on Intelligent Systems and Technology(TIST), 2022(2):1-41.
[1] 胡大伟. 人工智能嵌入档案开放审核的风险挑战及法律因应[J]. 档案学研究, 2025, 39(6): 43-50.
[2] 马识途. 数智时代档案开放审核的法理命题与规范更新[J]. 档案学研究, 2025, 39(5): 66-74.
[3] 刘子聪. 《中华人民共和国档案法实施条例》的功能定位、缺憾检视与优化路径[J]. 档案学研究, 2024, 38(5): 64-70.
[4] 王巧玲, 丁德胜, 谢永宪. 本土化实践背景下档案开放审核跨学科理论基础审视[J]. 档案学研究, 2024, 38(3): 13-18.
[5] 肖秋会, 王玉, 张博闻. 档案开放审核自由裁量权控制机制研究[J]. 档案学研究, 2023, 37(6): 61-68.
[6] 姚静, 徐拥军. 构建档案开放审核免责机制的必要性、困境与策略[J]. 档案学研究, 2023, 37(2): 74-80.