摘要:
【目的/意义】识别我国政府数据开放管理央地政策文本的内容主题及演化特征。【方法/过程】获取我国央
地政策文本,对政策文本进行筛选和剔除,运用LDA主题模型实现对政府数据开放管理政策文本内容的主题识别、
演化分析。【结果/结论】发现当前所发布的政府数据开放管理央地政策文本具有明显的生命周期特征,目前阶段处
于平缓期,其内容主题可以分为四大类,政府数据开放的数据安全管理是头号热点主题,每个主题随时间推移呈现
不同演化趋势。【创新/局限】采集大样本政策文本作为数据源,每篇只保留与主题高度相关的段落,利用LDA主题
模型进行政策文本的主题识别与分析,直观地揭示了中国政府数据开放管理央地政策文本的现状与趋势。