摘要: 【目的/意义】情节是故事中一系列事件的有序安排,是数据故事的骨架。本研究借鉴经典的 Freytag金字 塔型情节结构,提出数据故事的情节结构的生成方法,对数据故事的工程化研发具有重要意义。【方法/过程】首先, 界定了数据故事情节的概念,并讨论了其与文学故事中情节概念的区别,并明确了本研究所使用的Freytag金字塔 型情节结构。其次,探讨了情节的基本要素,即事件与情节结构,基于此提出情节的自动生成与呈现方法,主要涉 及事件推荐、事件采样、情节可视化和情节映射四项任务。最后,选取 UCI Breast-Cancer 公开数据集,利用 SPLIME、信息熵决策树、SMOTE等算法,实现数据故事情节的生成过程,并通过树状图和 Hype Cycle曲线图可视化 展示生成的数据故事情节。【结果/结论】在数据故事化领域首次明确界定了数据故事情节的类型及设计要素,提出 了Freytag金字塔型情节结构的自动生成方法。【创新/局限】本研究弥补了现阶段在数据故事构成要素方面研究的 缺失,提出了实验可行的数据故事情节生成方法及情节结构映射思路,为后续深入研究数据故事情节提供了一定 的启示。