Please wait a minute...
档案学研究  2019, Vol. 33 Issue (4): 40-49    DOI: 10.16065/j.cnki.issn1002-1620.2019.04.007
  档案资源建设 本期目录 | 过刊浏览 |
面向数字记忆的数字文档资源描述框架构建研究
牛力1,2, 蒋菲3, 曾静怡2
1 中国人民大学数据工程与知识工程教育部重点实验室 北京 100872
2 中国人民大学信息资源管理学院 北京 100872
3 浙江省建筑设计研究院 杭州 310006
Research on the Construction of Digital Document Resource Description Framework for Digital Memory
Li NIU1,2, Fei JIANG3, Jingyi ZENG2
1 Key Laboratory of Ministry of Education for Data Engineering and Knowledge Engineering, Renmin University of China, Beijing 100872
2 School of Information Resource Management, Renmin University of China, Beijing 100872
3 Zhejiang Province Institute of Architectural Design and Research, Hangzhou 310006
全文: HTML    PDF(1311 KB)  
输出: BibTeX | EndNote (RIS)      
摘要: 

基于描述框架采用信息抽取技术实现大量文档的核心内容挖掘是数字记忆背景下数字文档资源建设的新思路,直接体现知识服务的本质。文章从宏观与微观两个维度,构建了面向数字记忆的数字文档资源描述框架:囊括基本属性、关系属性与事件属性三种类型以及具体的属性项,同时设计了基于CIDOC CRM的属性映射机制,实现不同框架属性间的标准与共享。最后,进行历史人物主题属性构建,基于孔子这一具体人物进行填充和实例化,以验证描述框架的可行性与有效性,指导数字记忆资源建设实践。

关键词 数字文档资源描述框架数字记忆信息抽取知识服务    
Abstract

It is a new idea of constructing digital document resources under the background of digital memory to use information extraction technology to excavate the core contents of a large number of texts based on description framework, which can reflect the essence of knowledge service directly. From the macro and micro dimensions, this paper constructs a digital document resource description framework for digital memory, including three types of basic attributes, relational attributes and event attributes, as well as specific attribute items. At the same time, the attribute mapping mechanism based on CIDOC CRM is designed to realize the standards and sharing among different frame attributes. Finally, the construction of the theme attribute of historical characters is carried out, which is filled and instantiated based on the specific character of Confucius to verify the feasibility and effectiveness of the description framework, to guide the construction practice of digital memory resources.

Key wordsdigital document resource    description framework    digital memory    information extraction    knowledge service
出版日期: 2019-11-18
基金资助:本文系中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目成果“面向数字人文的‘记忆工程’理论、方法与实践研究”(项目编号:18XNI011)的研究成果之一。
引用本文:

牛力, 蒋菲, 曾静怡. 面向数字记忆的数字文档资源描述框架构建研究[J]. 档案学研究, 2019, 33(4): 40-49.
Li NIU, Fei JIANG, Jingyi ZENG. Research on the Construction of Digital Document Resource Description Framework for Digital Memory. Archives Science Study, 2019, 33(4): 40-49.

链接本文:

http://journal12.magtechjournal.com/Jwk_dax/CN/10.16065/j.cnki.issn1002-1620.2019.04.007      或      http://journal12.magtechjournal.com/Jwk_dax/CN/Y2019/V33/I4/40

[1] 余肖生,孙珊. 基于信息抽取的文本知识挖掘模型研究[J]. 情报科学,2010(5):776-778.
[2] 高强,游宏梁. 事件抽取技术研究综述[J]. 情报理论与实践,2013,36(4):114-117.
[3] 王宁,陈湧,郭玮,等. 基于知识元的突发事件案例信息抽取方法[J]. 系统工程,2014(12):133-139.
[4] 李向春. 基于规则的Web文本信息抽取技术的研究[D]. 电子科技大学,2011.
[5] 裘江南,师花艳,叶鑫,等. 基于事件的定性知识表示模型[J]. 系统工程,2009(10):1-8.
[6] [9] 毕崇武,王忠义,宋红文. 基于知识元的数字图书馆多粒度集成知识服务研究[J]. 图书情报工作,2017(4):115-122.
[7] 刘崇学. 高校图书馆开展知识服务探讨[J]. 图书馆学研究,2004(2):82-83.
[8] 李晓鹏,颜端武,陈祖香. 国内外知识服务研究现状、趋势与主要学术观点[J]. 图书情报工作,2010,54(6):107-111.
[10] 吴加琪. 数字人文兴起及档案工作的参与机制[J]. 档案建设,2017.
[11] 李波. 非物质文化遗产信息资源描述模型探析[J]. 四川理工学院学报(社会科学版),2011,26(3):118-121.
[12] 李建伟特色文化资源信息组织方法与数据共享模型研究—— 以“世界客都”古民居数字记忆工程为例[J].2017.
[13] 冷伏海,白如江,祝清松.面向科技文献的混合语义信息抽取方法研究[J]. 图书情报工作,2013,57(11):112-119.
[14] 秦兵,刘安安,刘挺.无指导的中文开放式实体关系抽取[J]. 计算机研究与发展,2015,52(5):1029-1035.
[15] 吴刚. 基于主题的中文事件抽取技术研究及应用[D]. 苏州大学,2009.
[16] 韩永峰. 网络新闻突发事件信息抽取技术研究[D]. 解放军信息工程大学,2012.
[17] 周双文. 基于领域本体的创业板公司年报风险信息抽取方法研究[D]. 湖南大学,2013.
[18] 刘方驰,钟志农,雷霖,等. 基于机器学习的实体关系抽取方法[J]. 兵工自动化,2013(9):57-62.
[19] 陈艳,周馨. 基于CIDOC CRM的文化遗产资源的元数据集成—— 以DC元数据的映射为例[J]. 现代情报,2010,30(5):60-63.
[20] CIDOC Documentation Standards Working Group. What is the CIDOC CRM?[EB/OL].(2006-09-12)[2018-02-27]. Available at: .
[21] 郝挺雷. 传统节日知识本体的构建及表示方法研究[D]. 华中师范大学,2011.
[22] 孙传明. 民俗舞蹈类非物质文化遗产数字化技术研究[D]. 华中师范大学,2013.
[23] 严政. 基于知识本体的中秋节知识模型研究[D]. 华东师范大学,2017.
[24] Doerr M, Science I O C, Heraklion, et al. Towards a Core Ontology for Information Integration[J]. Journal of Digital Information, 2003, 4(2003).
[25] Binding C, May K, Tudhope D.Semantic Interoperability in Archaeological Datasets: Data Mapping and Extraction Via the CIDOC CRM[C]// Research and Advanced Technology for Digital Libraries, European Conference, Ecdl 2008, Aarhus, Denmark, September 14-19, 2008. Proceedings. DBLP,2008:280-290.
[26] 黄勋,游宏梁,于洋. 关系抽取技术研究综述[J]. 现代图书情报技术,2013,29(11):30-39.
[27] 高强,游宏梁. 事件抽取技术研究综述[J]. 情报理论与实践,2013,36(4):114-117.
[1] 于英香,姚倩雯. 基于用户画像的企业科技行政审批档案知识服务模型构建[J]. 档案学研究, 2022, 36(3): 52-59.
[2] 刘晗,周耀林. 参与式共建:少数民族数字记忆建构模式及实现策略[J]. 档案学研究, 2022, 36(3): 60-67.
[3] 余昊哲. 记忆或是遗忘:档案事业如何应对被遗忘权的挑战?[J]. 档案学研究, 2021, 35(6): 64-71.
[4] 吕元智, 谷俊. 面向用户需求的视频档案资源描述框架构建研究[J]. 档案学研究, 2021, 35(6): 91-99.
[5] 牛力, 高晨翔, 刘力超, 刘慧琳. 层次与空间:数字记忆视角下名人档案的价值挖掘研究[J]. 档案学研究, 2021, 35(5): 138-144.
[6] 段荣婷, 夏子涵, 王昊. 档案著录关联数据化实现研究[J]. 档案学研究, 2021, 35(4): 100-110.
[7] 陈海玉, 向前, 何剑锋. 面向知识服务的抗战档案资源聚合与可视化展现探究[J]. 档案学研究, 2021, 35(2): 111-118.
[8] 夏天, 钱毅. 面向知识服务的档案数据语义化重组[J]. 档案学研究, 2021, 35(2): 36-44.
[9] 牛力, 高晨翔, 韩小汀. 模式与机制:知识工程视点下的档案知识服务研究[J]. 档案学研究, 2021, 35(2): 96-103.
[10] 聂勇浩, 郑俭. 社会共建视角的重大突发事件数字档案资源建设[J]. 档案学研究, 2021, 35(1): 96-103.
[11] 徐拥军,龙家庆. 疫情周期与文件生命周期叠加视角下的防疫档案管理研究[J]. 档案学研究, 2020, 34(4): 4-12.
[12] 魏扣, 李子林, 郝琦. 社交媒体应用于档案知识服务的SWOT分析[J]. 档案学研究, 2019, 33(1): 69-74.
[13] 牛力, 赵迪, 韩小汀. “数字记忆”背景下异构数据资源整合研究探析[J]. 档案学研究, 2018, 32(6): 52-58.
[14] 吕元智. 面向新型智库建设的档案知识服务工作发展对策研究[J]. 档案学研究, 2018, 32(5): 33-38.
[15] 曲春梅, 王静, 王宁. 近年来我国档案与记忆研究综述[J]. 档案学研究, 2017, 31(1): 17-23.