一种人工神经网络样本数据对数螺旋线扰动方法

来源:一级建造师 发布时间:2020-09-01 点击:

  一种人工神经网络样本数据对数螺旋线扰动方法

 摘要: 通过构建面向聚类的隐私保护数据扰动模型,利用对数螺线对原始数据进行扰动隐藏,维持原始数据的邻域关系稳定,实现数据集聚类可用性的有效维护;进一步提高BP神经网络的收敛速度,并且能够有效地避免数据隐私泄露,同时维持输出结果的可用性。

  Abstract: Perturbation model by building privacy preserving data clustering using hidden logarithmic spiral perturbations of the original data, maintaining stable raw data neighborhood relationship, the effective maintenance of data availability clustering; further mention BP neural networkthe convergence speed. Data privacy, while maintaining the availability of the output results and can be effectively avoided.

  关键词: BP神经网络;对数螺旋线;数据扰动;收敛速度

  Key words: BP neural network;logarithmic spiral;data perturbation;convergence rate

  中图分类号:TP392 文献标识码:A 文章编号:1006-4311(2013)02-0181-02

  0 引言

  人工神经网络的输入数据若能预先进行有效的数据处理,那么对隐藏层的数据处理可提供高效的数据,使得网络收敛速度得到较快改进,数据扰动不仅是解决了该问题,而且可以对原始数据中的隐私信息得到有效的保护。

  1 对数螺线方程

  对数螺旋线上的动点的与极坐标的极径始终保持定角β的轨迹,称为对数螺旋线(如图1所示),它的极坐标方程为:r=r0ekθ。

  期中:r0、k为常数,k=ctgβ,r0为起始极径,θ为极角,r为极径。

  在直角坐标系中其方程为:

  x=r0ekθcosθ y=r0ekθsinθ

  2 对数螺线特性

  对数螺旋线具有良好的几何特性,主要表现在以下几方面:①在一条对数螺旋线上,每个点的螺旋角每处都相等,运动点的运动方向与极径之间的夹角β始终固定值,称该角度为对数螺旋线的螺旋角,即螺旋线上每点的螺旋角都相等。②螺旋线与它的等距曲线全等始终保持螺旋线的螺旋角都不会不变,改变它的起始极径r0,那么就会形成一系列的等距螺旋线族,它们是全等的螺旋线。③针对多维数据,若进行对数螺线扰动,始终不会改变数据集的数据附近之间的关系。④对数据集进行多重对数螺线扰动,不会改变数据集的数据邻域关系。⑤多重对数螺线扰动可以增强隐私保护的安全性。

  综上所述,通过对数螺旋线对数据进行扰动,不会改变原始数据的基本特性。

  3 对数螺旋线数据扰动方法

  考虑将对数螺线的几何性质应用于微数据隐藏发布,借助对数螺线对数据点进行扰动,隐藏原始数据。具体思路如下:通过对数螺线的旋转和缩放使数据点落于对数螺线上,再使数据点沿螺线方向在螺线上移动,从而对原数据进行扰动保护,将这种扰动方法称之为对数螺线扰动。

  设原始数据点为A,对数螺线扰动函数为F,扰动后数据点为A′,F×A表示运用函数F对数据点A进行扰动,则对数螺线扰动可以表示为F×A→A′。

  在二维平面上,给定一条对数螺线,对于平面上任意一点,若该点落在对数螺线上,则使该点顺着螺线的方向在螺线上移动;若该点不在螺线上,则使螺线绕其螺心旋转直至使该点落于螺线上,再使该点在螺线上沿螺线方向移动,将这种扰动方法称之为二维对数螺线扰动,如图2所示。

  设点A(Ai,Aj)为二维平面上的任意一点,设对数螺心为O(x,y),对数螺线方程为r=aekθ,旋转扰动角度为Δθ,如图2所示,二维对数螺旋线扰动可分解为旋转和缩放两部分,点A先缩放至点A″,再围绕螺心旋转至点A′。

  设θA为点A相对于对数螺线的极角,缩放参数k为扰动后的点A′与螺心的距离|A′|与扰动前的点A与螺心的距离|OA|的比,则

  k=■=■=■=e■

  其中r■、r■分别为点A、A′的极径。则扰动后点A′(A■■,A■■)的坐标为

  A■■=k·rA·cosθ■+Δθ+x A■■=k·r■·cosθ■+Δθ+y

  根据给定的参数,设二维螺旋线扰动函数为F(k,Δθ,O(x,y)),则二维对数螺旋线扰动可以表示为:

  F(k,Δθ,O(x,y))×A(Ai,Aj)→A′(A■■,A■■)

  将多维数据集D中的多维属性随机划分成一组不相交的二维、三维投影子集,给定缩放参数k。对于二维投影子集,给定螺心O(x,y)和扰动角度Δθ,进行二维对数螺线扰动;对于三维投影子集,给定螺心O(x,y,z)、螺轴向量V(a,b,c)和扰动角度Δθ,进行三维对数螺线扰动,最后将原数据集替换为扰动后的数据集D′。对数据集D进行t次这样的对数螺线扰动,最终得到t重对数螺线扰动后的数据集D(T)。

  4 人工神经网络样本质量对网络的影响

  BP神经网络能够较好地解决I/O之间的映射关系的不明确问题,大部分的人工神经模式在模式识别问题中,其I/O的映射关系难于用解析的方法来求解,故神经网络很难适用来解决模式识别中的有关问题。BP神经网络的样本主要分为训练样本及测试样本,神经网络中样本的本身质量,在一定程度上影响着预网络的预测结果。首先,输入的训练样本及待预测样本平均值存在较大差异,神经网络的预测误差值,就会随着增长预测时间的训练不断增大。再次,如果训练误差会随训练样本及待预测样本均值的差异增大而逐渐增大。

  所以把用于BP神经网络的训练样本和待预测样本先进行数据扰动,可以保证数据的安全性和可用性,先用对数螺旋线进行t重扰动,再进行BP神经网络的训练,最后用输入样本数据进行预测,实验证明使用扰动后的数据进行训练的网络比用原始数据归一化处理后训练的网络收敛速度快,且输出结果更加可靠。

  5 实验与分析

  BP人工神经网络的主要功能是能以任意精度逼近任意连续函数,几乎所有的模式识别及分类问题基本能看作从模式空间到类别空间的一个映射,故BP神经网络模式分类方法能用于解决任意复杂度的模式分类问题。BP神经网络泛化能力较强,若用少量的训练样本对网络进行训练后,那么BP神经网络对训练阶段,也能对没有遇到的新样本给出正确分类。神经网络的这种泛化性,是其它模式分类方法无法的。

  使用传统的神经网络方法,可以较好的解决模式分类问题,但因为训练样本数量和分布不可能是理想的,若使用样本集训练分类器所得到的分类面始终与最优分类是存在差异,这就导致了人工神经网络的泛化能力。为了提高人工神经网络的泛化能力及收敛速度,有许多专家做了大量的工作,但由于这些研究主要是集中分析人工神经网络的参数和训练样本等对泛化能力的影响,对用新的方法提高网络的泛化能力及泛化能力的稳定性很少涉及[2]。

  采用文献[1]中的例子,在MATLAB下用误差投影和局部投影算法,对RBF网络进行仿真实验,优化BP网络参数,预测某种水泥在凝固时放出的热量y(卡/克)与水泥中下列四种化学成分之间的关系,实验样本数据为表1中的数据。

  其中,x1,x2,x3,x4的含意如下:x1:3CaO·Al2O3的成分(%);x2:3CaO·SiO2的成分(%);x3:4CaO·Al2O3·Fe2O3的成分(%);x4:2CaO·SiO2的成分(%)。

  用对数螺旋线进行t重扰动(取整),对表1的扰动后的输入如表2所示。

  对BP网络训练后,对表2中的实际值进行预测,实验结果如表3。

  6 结论

  采用对数螺旋线对输入样本数据进行扰动,保持了数据的原始特性不变的情况下,加快了BP人工神经网络的收敛速度,精度得到了较大的提高,而且对数据中的隐私得到了有效的保护。经过MATLAB仿真实验,仿真结果见表3,从该表可以看出,与文献[2]的结果比较仿真精度得到了较大的提高,平均误差为-0.27,标准方差为0.7732。

  参考文献:

  [1]Kadirkamanathan V, Niranjan M. A function estimation approach to sequential learning with neural networks. Neural Computation,1993,5(4):954-975.

  [2]宋绍云等.人工神经网络中的样本对输出精度影响分析[J].河北:价值工程,2010-5-3.

  [3]李江红等.RBF神经网络的一种新的学习算法[J].长沙:长沙电力学院学报(自然科学版),2000,15(1):39-42.

  [4]杨戈等.一种新型RBF网络序贯学习算法[J].北京:中国科学E辑,2004,34(7):763-775.

  [5]唐启义,冯明光.DSP数据处理系统[M].北京:科学出版社,2006,9.

推荐访问:浅谈对数螺旋线 螺旋线 扰动 神经网络
上一篇:(开展党建品牌创建活动实施方案作者
下一篇:浅谈初中数学辅助线添加

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有