Please wait a minute...
档案学研究  2025, Vol. 39 Issue (2): 92-101    DOI: 10.16065/j.cnki.issn1002-1620.2025.02.011
  档案资源开发 本期目录 | 过刊浏览 |
数据叙事视角下红色档案资源语义组织研究
熊回香1,陈子薇2,肖兵1
1 华中师范大学信息管理学院 武汉 430079
2 福建医科大学研究生院 福州 350122
Research on Semantic Organization of Red Archive Resources from the Perspective of Data Storytelling
Huixiang Xiong1,Ziwei Chen2,Bing Xiao1
1 School of Information Management, Central China Normal University, Wuhan 430079
2 Graduate School, Fujian Medical University, Fuzhou 350122
全文: HTML    PDF(1790 KB)  
输出: BibTeX | EndNote (RIS)      
摘要: 

为应对目前红色档案资源组织在语义描述、语义关联、知识表达等方面存在的不足,本文尝试在数据叙事视角下构建红色档案资源语义组织理论框架。首先,从红色档案的叙事目的出发,构建红色档案资源的知识描述体系,并采用本体技术对红色档案资源知识进行规范化描述。其次,分别选择BERT-BiGRU-CRF、RoBERTa、ERNIE模型抽取红色档案资源中的知识单元、单元间的关系以及事件。基于此,分别以人物、地点、时间为叙事主线,对识别的红色档案资源知识单元进行多维整合及可视化。最后,通过采集长征档案数据,抽取其中的知识单元及其关系,并识别长征各类事件信息,从多维叙事主线清晰展现长征人物关系图谱、长征路线、长征事件发展情况。由此证明在本文提出的数据视角下红色档案资源语义组织框架的可行性与有效性。

关键词 语义组织红色档案资源数据叙事本体知识图谱    
Abstract

To tackle the shortcoming in semantic description, sematic association, knowledge expression of current organization mode of red archive resources, this paper tries to construct a theoretical framework for the semantic organization of red archive resources from the perspective of data storytelling. Firstly, starting from the narrative purpose of red archives, the main narrative elements and their semantic relationships of red archive resources are extracted, to form a knowledge description system for the resources. On this basis, ontology technology is used to describe the knowledge of red archive resources in a standardized way. And then, the BERT-BiGRU-CRF, RoBERTa and ERNIE model are used to extract knowledge units and recognize the relations between the units and extracting events from red archive resources respectively. On the basis, taking characters, places and time as narrative mainlines respectively, multi-dimensional integration and visualization are carried out on the knowledge units of the identified red archive resources. Finally, by collecting the Long March archive data, extracting the knowledge units and their relationships, and identifying the information of various events of the Long March, the relationship map of the Long March characters, the route of the Long March and the development of the Long March events are clearly presented from the multi-dimensional narrative mainline. The feasibility and effectiveness of this semantic organization framework of the red archive resources from the perspective of data storytelling are verified.

Key wordssemantic organization    red archive resources    data storytelling    ontology    knowledge graph
出版日期: 2025-04-28
通讯作者: 陈子薇   
引用本文:

熊回香, 陈子薇, 肖兵. 数据叙事视角下红色档案资源语义组织研究[J]. 档案学研究, 2025, 39(2): 92-101.
Huixiang Xiong, Ziwei Chen, Bing Xiao. Research on Semantic Organization of Red Archive Resources from the Perspective of Data Storytelling. Archives Science Study, 2025, 39(2): 92-101.

链接本文:

https://journal12.magtechjournal.com/Jwk_dax/CN/10.16065/j.cnki.issn1002-1620.2025.02.011      或      https://journal12.magtechjournal.com/Jwk_dax/CN/Y2025/V39/I2/92

[1] 王娅, 王向女. 我国红色档案资源研究综述[J]. 兰台世界, 2019(2):34-37.
[2] 陆伟华, 邓素媛. 广西红色档案资源的开发应用研究[J]. 山西档案, 2017(1):85-87.
[3] [29] 周林兴, 姜璐. 红色档案资源开发中的叙事表达研究[J]. 档案学研究, 2022(4):4-9.
[4] 朱玉媛, 周耀林. 关于人事档案管理的对话录[J]. 档案管理, 2009(6):12-19.
[5] ALFREDO S J, AUXILIO M M, STAROSTENKO O, et al. Organizing open archives via lightweight ontologies to facilitate the use of heterogeneous collections[J] Aslib Proceedings, 2012(1):46-66.
[6] MESSAOUDI T, VÉRON P, HALIN G, et al. An ontological model for the reality-based 3D annotation of heritage building conservation state[J]. Journal of Cultural Heritage, 2018(29):100-112.
[7] 赵雪芹, 李天娥. 面向数字人文的档案领域本体构建研究—以万里茶道档案资料为例[J]. 情报理论与实践, 2022(8):154-161.
[8] HAWKINS A. Archives, linked data and the digital humanities: increasing access to digitised and born-digital archives via the semantic web[J]. Archival Science, 2022(3):319-344.
[9] 吕元智. 数字档案资源知识“关联”组织研究[J]. 档案学研究, 2012(6):44-48.
[10] 吕元智. 数字档案资源跨媒体语义关联聚合实现策略研究[J]. 档案学研究, 2015(5):60-65.
[11] 张斌, 高晨翔, 牛力. 对象、结构与价值:档案知识工程的基础问题探究[J]. 档案学通讯, 2021(3):18-26.
[12] LUTTMER J, EHRING D, PLUHNAU R, et al. Representation and application of digital standards using knowledge graphs[J]. Proceedings of the Design Society, 2021(1):2551-2560.
[13] 刘慧琳, 牛力. 标准文件的知识图谱组织模式探究[J]. 档案学通讯, 2021(5):58-65.
[14] 赵雪芹, 路鑫雯, 李天娥, 等. 领域知识图谱在非遗档案资源知识组织中的应用探索[J]. 档案学通讯, 2021(3):55-62.
[15] 张卫, 王昊, 李跃艳, 等. 面向非遗文本的知识组织模式及人文图谱构建研究[J]. 情报资料工作, 2021(6):91-101.
[16] 翟乐, 李金格. 数字人文视阈下红色档案资源的遴选、组织与开发策略研究[J]. 情报科学, 2021(12):174-178, 186.
[17] 赵红颖, 张卫东. 数字人文视角下的红色档案资源组织:数据化、情境化与故事化[J]. 档案与建设, 2021(7):33-36.
[18] 陈忻, 房小可, 孙鸣蕾. 社会记忆再生产:北京香山红色档案编研成果的细粒度挖掘研究[J]. 山西档案, 2021(1):80-87, 79.
[19] 孟刚. 数据故事化中的数据关键特征表达有效性研究[J]. 情报理论与实践, 2023(2):117-126.
[20] 朝乐门, 张晨. 数据故事化:从数据感知到数据认知[J]. 中国图书馆学报, 2019(5):61-78.
[21] Analytics Vidhya Content Team. The art of storytelling in data science and how to create data stories[EB/OL].[2022-08-30]. https://www.analyticsvidhya.com/blog/2017/10/art-story-telling-data-science/.
[22] 朝乐门. 数据故事的自动生成与工程化研发[J]. 情报资料工作, 2021(2):53-62.
[23] 赵雪芹, 彭邓盈政, 雷春蓉, 等. 数字记忆视角下的档案数字叙事服务模型及实现路径[J]. 档案与建设, 2022(1):29-32.
[24] 牛力, 高晨翔, 张宇锋, 等. 发现、重构与故事化:数字人文视角下档案研究的路径与方法[J]. 中国图书馆学报, 2021(1):88-107.
[25] OBIE H O, CHUA C, AVAZPOUR I, et al. Authoring logically sequenced visual data stories with gravity[J]. Journal of Computer Languages, 2020(3):1-13.
[26] 曾静怡. 上下文在照片档案叙事中的应用[J]. 档案学研究, 2021(6):100-105.
[27] 冯惠玲. 数字人文视角下的数字记忆—兼议数字记忆的方法特点[J]. 数字人文研究, 2021(1):87-95.
[28] 谢诗艺, 杨珮琪. 建构群体认同:红色档案资源开发的逻辑理路[J]. 档案与建设, 2021(12):26-29.
[30] 朱琳, 闫静. 党史学习教育背景下红色档案叙事研究—以百集微纪录《红色档案》为例[J]. 山西档案, 2022(3):68-75.
[31] 马费成. 情报学的进展与深化[J]. 情报学报, 1996(5):22-28.
[32] 刘芳, 吴振新. 文化遗产的数字叙事现象分析及应用建议[J]. 数字图书馆论坛, 2023(11):46-52.
[33] 朱兰兰, 段燕鸽. 叙事理论在红色档案资源开发中的应用—以大别山区为例[J]. 档案学研究, 2023(2):95-102.
[34] 边媛, 舒丽莎. 场景理论视域下红色档案资源开发利用优化路径[J]. 中国档案, 2024(2):72-74.
[35] 朱彤, 王兴广, 唐懿飞. 新时代我国红色档案管理的实然困境与应然进路[J]. 档案学通讯, 2024(1):20-27.
[36] 中国工农红军长征史料丛书编审委员会. 中国工农红军长征史料丛书[M]. 北京: 解放军出版社, 2016.
[1] 陈永生, 包惠敏. 我国历史档案研究的焦点透视与趋势展望(2000—2024)——基于CiteSpace的可视化分析[J]. 档案学研究, 2025, 39(1): 4-13.
[2] 张丽华, 周耀林, 刘芮. 媒介融合视域下红色档案资源传播的现实困境与纾解之道[J]. 档案学研究, 2025, 39(1): 97-104.
[3] 刘朔宇, 吕星月, 李依诺, 冯宇琦, 袁曦临. 红色家族书信档案中的社会伦理结构变迁研究[J]. 档案学研究, 2024, 38(5): 90-99.
[4] 张宁, 刘焕成, 李孟璐. 基于符号互动论的红色档案资源价值传播影响因素研究[J]. 档案学研究, 2024, 38(3): 76-86.
[5] 王平,谢雨霏,端文卓,侯景瑞. 基于本体的气象记录档案知识图谱构建与应用研究[J]. 档案学研究, 2024, 38(3): 94-103.
[6] 梁文超. 数字人文视域下湘鄂赣红色档案在线知识服务创新路径研究[J]. 档案学研究, 2023, 37(6): 85-92.
[7] 周则旭, 韩红旗, 张均胜, 周潇, 徐紫燕. 基于通用信息抽取模型的年鉴大事记知识图谱构建研究—以林业大事记知识图谱为例[J]. 档案学研究, 2023, 37(5): 140-148.
[8] 孙大东, 张怡涵. 基于事理图谱的红色档案资源开发利用研究[J]. 档案学研究, 2023, 37(5): 73-80.
[9] 陈慧, 刘赛楠, 廖雪琴. 全域旅游背景下红色档案资源全景式呈现模式探索— 以洪湖市红色档案开发利用为例[J]. 档案学研究, 2023, 37(4): 108-117.
[10] 朱兰兰, 段燕鸽. 叙事理论在红色档案资源开发中的应用— 以大别山区为例[J]. 档案学研究, 2023, 37(2): 95-102.
[11] 周耀林, 张丽华, 刘红. 叙事传输视角下红色档案资源社会共建模式与实现路径研究[J]. 档案学研究, 2023, 37(1): 82-90.
[12] 倪丽娟. 红色档案资源开发与公民国家记忆培育[J]. 档案学研究, 2022, 36(4): 10-16.
[13] 陈艳红, 陈晶晶. 数字人文视域下档案馆红色档案资源开发的时代价值与路径选择[J]. 档案学研究, 2022, 36(3): 68-75.
[14] 房小可. 面向社会记忆重构的档案信息语义组织研究[J]. 档案学研究, 2022, 36(2): 77-82.
[15] 曾静怡. 上下文在照片档案叙事中的应用[J]. 档案学研究, 2021, 35(6): 100-105.