地方志智能化超级数据库标准方向与建设方案概述

来源:新西兰移民 发布时间:2021-04-20 点击:

地方志智能化超级数据库标准方向与建设方案概述 唐远波 成都市地方志编纂委员会办公室 前言:成都市地方志编纂委员会办公室按照“检索历史、感知现实、预测未来”的信息化发展总目标,经过近3年探索及实践,目前已完成了具有“云平台、编纂系统及移动app”三大特点的“数字方志馆”建设,该系统在方便修志工作的同时及扩大了方志文化影响力。但是随着信息化不断发展,我们意识到智能化是未来发展的方向和目标,作为地方志来讲,信息化发展一定要有前瞻性、根本性和战略性,以智能化超级数据库为核心,以实现智能修志、智能识别、智能抓取、智能生成为目的,建设全面、超前的“智慧方志馆”是未来方志系统信息化建设的核心,因此,建立地方志智能化超级数据库就变成了建设“智慧方志馆”基础。经过查阅大量资料,写下了这篇概述。

关键词:智慧方志馆、智能化、数据库、元数据、子系统 一、 以元数据和元业务为技术依托,建设成都市地方志超级数据库 地方志大数据库的构建是地方志系统信息化建设的核心,主要肩负着方志资源数据的存储和检索,也是“智慧方志馆”的神经大脑。

智能化的方志采集分类:通过大数据体系的元数据技术对方志库进行重新的梳理,将书籍文本类数据、视频类数据、音频类数据、图片类数据等按照其各自收集的渠道进行分类、整理和存储,实现方志数据的可识别、可理解、可查找和对方志资源库的有效组织和管理。

这样,方志办通过统一的界面,按照各种分类,查询和浏览历年来入库的书籍、文本、视频、音频、图片,而无须到各个子系统内去查询浏览,查询起来更加简单统一! 智能化的神经元联系关联:通过对下辖的资源库、全文文本库、地名库、人物库、景观库、插图库、书目库、馆藏文物库等多种子库,子库之间采用元业务技术建立基础库系统,实现基础库的单库、跨库和全文检索库等各种形式的关联查找。例如全文数据库,对馆藏志书进行全文数字化处理,并通过元数据加以识别和标引,实现为读者提供全文文本、全文检索和智能分析服务。

经过智能化的神经元联系关联后,“智慧方志馆”数据库中的全文文本库、地名库、人物库、景观库、插图库、书目库、馆藏文物库的各个条目之间都建立的各种各样的有机联系,修志专家及普通大众可以通过关联查询,通过一个条目,关联列出相似的条目,有联系的条目,查询浏览更加方便和智能! 统一方便的智能查询入口:多样化的查询选项,实现一键查询、跨界查询、模糊查询,方便我们对基础数据的检索和引用。

这样,修志专家及普通大众都可以通过统一的界面进行各种查询,就如百度搜索引擎的界面一样,通过简单的操作实现复杂的信息查询,查询起来也更加快捷! 二、 以智能修志、智能识别、智能抓取、智能生成为目的建设编纂系统,通过IMS信息管理系统规范管理各个元素和环节。

(一)智能抓取:
(1)系统接入成都政务大数据平台,实现信息的接入、采集、数据仓库的建立。

逐步形成地情大数据,建立成都地情大数据主题应用,实现感知成都、感知未来。采用前置数据库抽取、服务接口对接等方式接入成都市政务大数据,获取政务大数据信息。

这样,修志专家及普通大众就可以实时查询当下成都政府现有的公开数据,包括对政府部门公开的政务数据,而无需各个部门再报送具体的某个指标数据,查询结果也更加客观、准确、实时。

(2)视频信息接入采集: 视频信息接入与采集系统实现对各类行业视频以及社会视频进行统一接入和信息采集,为“智慧方志馆”数据库提供官方和非官方的视频资料,实现定时采集、记录地理人文和社会变迁。

这样,修志专家及普通大众就可以通过政府公开的视频数据中和社会视频是提取所需的视频和图片素材用于方志的编纂,视频素材的使用也更加丰富起来! (3)互联网信息采集:互联网信息的接入将在信息资源的规模上对大数据提供更加丰富的数据资源。平台搭建基础的分布式爬虫工具,通过二次定制开发,使平台具备对互联网门户网站、网络社交论坛、微博舆论信息、微信公众号等相关信息资源。

这样,修志专家及普通大众就可以通过政府公开的社交媒体大数据提取所需的文字、图片等素材用于方志的编纂,社交媒体的数据使用也会更加丰富起来。

(二)智能识别:数据源接入数据之后,经过数据清洗、数据转换步骤,对采集来的数据进行必要的清洗和抽取处理,从而提高数据的整体质量,并对数据进行压缩,节约系统资源,数据识别包括:基础核心内容抽取、脏数据及废数据清洗、数据脱敏和脱密等。

这样,修志专家及普通大众通过大数据智能抓取方式采集的各类数据,通过智能化的分析处理以后,去掉重复数据和脏数据、并对数据进行分类整理,通过统一的界面进行分类查询和搜索,为方志的编纂提供便捷化的工具,为方志编纂提供高质量的数据! (三)智能修志:直接为成都方志办编纂服务,将实现从搜集资料、撰写文稿到校对编辑等各个程序的网络化操作和文档实时保存,以逐步改变地方志的传统编修方式,以提高成都方志办编纂质量。待编修完毕,进行延伸开发,形成志书编纂、管理通用软件系统,在更大范围内供地方志工作者使用。

这样,修志专家及普通大众通过数据的分析处理、统一的查询搜索,就可以为地方志的智能修志,提供源源不断的数据来源和方便快捷的查询搜索和编辑工具,修志工作也更加的智能化。

(四)智能生成:算法是提升数据利用效率的重要路径,系统通过方志超级数据库的数据分析和挖掘,按照各种算法:聚类算法、分类算法、关联规则算法、时间序列算法、文本挖掘算法和图像挖掘算法等对数据进行再加工,找到和自动生成编纂所需的报表和数据,方便我们对基础数据的加工和引用,实现数据的高质量分析。

这样,通过各类算法,可以自动整理出:譬如,同一个地点在记录的时间范围内的变化情况,某个时间点成都各个位置的状态和关系等等各种不同角度来看待成都的发展和变迁,为地方志编纂提供多维度、多角度的数据支撑! (五)IMS 信息管理系统:数据、业务、模型、算法关联紧密,例如:算法模型分类行业模型和业务模型两大类。行业模型主要包括交易预测、客户分析、资料推荐、风险决策、人力资源等模型;
业务模型主要包括舆情发现、社交匹配、信息检索等模型。尽管有了这一系列的模型,但并不代表他们都千篇一律,每种模型在实际业务场景下又会千差万别,实现方式也是千变万化。需要一套信息管理系统,对系统的各个元素进行规范科学的管理,以提供系统的复用率和效率。

虽然数据在不断的发生变化,也有源源不断的数据的进入,但方法和模型相对比较稳定,这样,方志就通过管理和优化这样数据模型、处理算法,为方志编纂提供源源不断的更加智能、更高维度的信息数据。

三、 将智能化超级数据库应用到门户网站和编纂系统中,实现方志展示的智能化和专业化。

结合智能化超级数据库的多维度、多角度、高维度的数据成果,让公众看到综合视角、更高维度反映成都的历史人文、社会发展情况、时代变迁,纵贯古今、横及百科,并通过对现有门户网站、编纂系统的升级改造以及移动端匹配,将“互联网+智慧方志馆”快速的推向公众。这样,无论是PC端和移动端都可以方便快速的访问超级数据库的专业内容,用户访问体验更好,门户网站也将更加智能化和专业化。

参考文献:
1. 《国家信息化发展战略纲要》《“十三五”国家信息化规划》  2. 《全国地方志事业发展规划纲要(2015—2020年)》
3. 《全国地方志信息化发展规划(2016—2020年)》
4. 《全国信息方志与数字方志建设工程实施方案
5. 《成都市政务大数据目录体系建设工程方案》
6. 《数数据挖掘 概念与技术(原书第3版)》 范明,孟小峰 译. 机械工业出版社, 2012年。

7. 《数据科学与大数据分析, 数据的发现 分析 可视化与表示》 曹逾,刘文苗,李枫林 译, 2016年。

8. 《神经网络原理(Simon Haykin: Neural Networks) 》 叶世伟, 史忠植 译. 机械工业出版社,2004年。

作者姓名:唐远波 职务:成都市地志办信息化办公室负责人 电话:18681371940,02861884916 邮箱:64957890@qq.com 地址:四川省成都市高新区天仁路260号 邮编:610041

推荐访问:
上一篇:副县长在全县第一季度农村经济工作会议上讲话
下一篇:副县长在全县农村信用工程建设推进会上讲话

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有