Please wait a minute...
档案学研究  2025, Vol. 39 Issue (4): 98-106    DOI: 10.16065/j.cnki.issn1002-1620.2025.04.012
  档案信息化 本期目录 | 过刊浏览 |
档案文本事实粒子解构:概念、模型、方法与实证
赵生辉,王倩,肖舒淇
苏州城市学院城市治理与公共事务学院 苏州 215105
Archival Text Fact Particle Deconstruction: Conceptions, Models, Approaches and Empirical Study
ZHAO Shenghui,WANG Qian,XIAO Shuqi
School of Urban Governance and Public Affairs of Suzhou City University, Suzhou 215105
全文: HTML    PDF(1401 KB)  
输出: BibTeX | EndNote (RIS)      
摘要: 

传统档案管理与服务将文献作为基本信息单元,在奠定我国档案事业根基的同时存在流程断链、需求错位、支持缺位、性能瓶颈等不足,难以有效满足人工智能时代的档案精准化利用需求。本文致力于应对档案文献管理面临的现实挑战,基于档案事实语义颗粒化数据表征的视角,提出“档案文本事实粒子解构”的学术概念,构造事实逻辑模型,探索相关技术方法,并以实例验证其有效性。档案文本事实粒子解构是档案管理机构在档案预处理文本的基础上,参照事实逻辑 模型,通过对相关实体、属性和关系的识别和RDF表征,将档案文献的事实信息转换为颗粒化的准等义记录因子数据集合的技术过程,其应用有望驱动我国档案事业的智能化转型,并从整体上重塑传统档案文献服务的信息生态。

关键词 档案事实检索文本解构语义网记录因子    
Abstract

Traditional archival management and services take documents as basic information unit. While laying the foundation for China's archival endeavors, this approach suffers from fragmented workflows, misaligned demands, insufficient support, and performance bottlenecks, making it difficult to meet the need for precise archival utilization in the AI era effectively. This paper aims to address the above practical challenges that archival document management faces. From the perspective of granular semantic data representation of archival facts, it proposes the academic concept of archival text fact particle deconstruction, constructs a fact-logic model, explores relevant technical methods, and validates their effectiveness through case studies. Archival text fact particle deconstruction is a technical process carried out by archival institutions, based on preprocessed texts and guided by the fact-logic model, identify relevant entities, attributes, and relationships, and represent them by RDF (Resource Description Framework) format, then transforms factual semantic information of archival document into granular, quasi-isomorphic set of record factors data. Its application is expected to drive the intelligent transformation of China's archival sector and holistically reshape the information ecology of traditional archival document services.

Key wordsarchive fact retrieval    text deconstruction    semantic web    record factors
出版日期: 2025-08-28
引用本文:

赵生辉, 王倩, 肖舒淇. 档案文本事实粒子解构:概念、模型、方法与实证[J]. 档案学研究, 2025, 39(4): 98-106.
ZHAO Shenghui, WANG Qian, XIAO Shuqi. Archival Text Fact Particle Deconstruction: Conceptions, Models, Approaches and Empirical Study. Archives Science Study, 2025, 39(4): 98-106.

链接本文:

https://journal12.magtechjournal.com/Jwk_dax/CN/10.16065/j.cnki.issn1002-1620.2025.04.012      或      https://journal12.magtechjournal.com/Jwk_dax/CN/Y2025/V39/I4/98

[1] 金波, 添志鹏. 档案数据内涵与特征探析[J]. 档案学通讯, 2020(3):4-11.
[2] 红山. 熟悉档案内容和编制参考工具[J]. 档案工作, 1964(4):13.
[3] 张会超. 档案内容管理引论[J]. 山西档案, 2007(1):21-24.
[4] 胡涛. 档案内容管理模式研究[J]. 档案学研究, 2015(4):54-57.
[5] 丁家友, 方鸣, 冯洁. 论档案内容管理的理论体系与技术路径[J]. 档案学研究, 2020(1):19-24.
[6] 丁华东. 档案知识管理范式的理论特点与建构策略[J]. 图书情报知识, 2007(4):18-20.
[7] 徐拥军. “档案知识管理”系统构建的原则与策略[J]. 档案学通讯, 2009(2):58-62.
[8] 张斌, 高晨翔, 牛力. 对象、结构与价值:档案知识工程的基础问题探究[J]. 档案学研究, 2021(3):18-26.
[9] 赵生辉, 胡莹, 宋和平. 档案语义参照框架:逻辑、架构与实证[J]. 档案学通讯, 2023(1):53-60.
[10] 王平, 彭思源, 李沐妍, 等. 基于形式与内容交互的红色档案语义表示[J]. 档案学通讯, 2024(6):64-72.
[11] 冯惠玲, 李宪. 档案检索的原理与方法[M]. 北京: 中国科学技术出版社, 1990:2.
[12] 冯惠玲. 档案文献检索[M]. 北京: 高等教育出版社, 1999:2.
[13] 洪漪. 档案信息组织与检索[M]. 武汉: 武汉大学出版社, 1998:5.
[14] 王向明. 档案文献检索[M]. 上海: 上海大学出版社, 2001:9.
[15] 陈忠海. 档案管理学[M]. 郑州: 河南人民出版社, 2006:116.
[16] 冯契. 哲学大辞典[M]. 上海: 上海辞书出版社, 1992:116.
[17] 赵生辉, 胡莹. 档案数据化底层逻辑的解析与启示[J]. 档案学通讯, 2021(4):20-27.
[18] 王杰. 北洋大学堂与中国近代高等教育的缘起[J]. 高教探索, 2008(6):74-80.
[19] 刘开瑛, 由丽萍. 汉语框架语义网[M]. 北京: 科学出版社, 2015:116.
[20] 孙大东, 张怡涵. 基于事理图谱的红色档案资源开发利用研究[J]. 档案学研究, 2023(5):73-80.
[21] 肖仰华. 知识图谱:概念与技术[M]. 北京: 电子工业出版社, 2020:116.
[22] 今日头条官网. 1924年北海盐务稽核所日人悬挂日旗事件[EB/OL].[2024-12-21]. https://www.toutiao.com/article/6310186957242630658/.
[23] 孙保全. 实体化与结构化:中华民族历史建构的双重逻辑[J]. 思想战线, 2017(2):94-100.
[24] 冯琳. 顾维钧档案与台湾史研究[J]. 台湾史研究, 2023(2):88-94.
[25] 林周佳. 档案语义级检索技术研究[J]. 档案与建设, 2007(9):24-25.
[1] 夏天, 钱毅. 面向知识服务的档案数据语义化重组[J]. 档案学研究, 2021, 35(2): 36-44.
[2] 王志宇, 熊华兰. 语义网环境下数字档案资源关联与共享模式研究[J]. 档案学研究, 2019, 33(5): 114-119.
[3] 段荣婷. 《中国档案主题词表》语义网络化应用研究*[J]. 档案学研究, 2010, 24(6): 66-70.