全球旧事资料 分类
时空数据分析算法及其应用研究
f时空数据分析算法及其应用研究
空间和时间是现实世界最基本、最重要的属性,许多空间应用系统都需要
表达地学对象的时空属性,例如在地理位置变更、环境监测、城市演化等领域
都需要管理历史变化数据,以便重建历史、跟踪变化、预测未来。面向对象的
技术是用在软件设计中的一种方法,它用在时空数据1表达中主要是为了克服给
定实体的空间或非空间属性在不同时间不同频率变化而出现的复杂问题2。下面
从KNN、RNN、SkyLi
e三种时空数据分析算法出发,论述时空数据分析算法的应
用。
1、KNN分析算法的基本概述及应用分析
KNN算法是非参数回归模型的基本算法之一,通过在状态空间中搜索与待测
点X相近的k个样本Xi,Yi估计g
x,因此又称为k最近邻非参数回归,其预测
函数3可表示为
k
k
YgXWi(X;Xk1,…,Xkk)YikiYi
(1)
其中Xk1.表示i1与x距离最近的点,并赋予权i值1k1;Xk2则被赋予权值k2;以此
类推,得到k个权函数k1,k2,,kk,满足
k
k1≥k2≥…≥kk≥0,ki1
(2)
KNN算法通过计算样本个体i1之间的距离或者相似度来寻找与每个样本个体
最相近的K个个体,在这个过程中需要完成一次样本个体的两两比较,所以算法
的时间复杂度,跟样本的个数直接相关。
K最近邻算法通常情况下是用于分类的,这只是对K近邻算法用途的本质说
明4。从实际来看,K近邻算法可以应用的地方还有很多,比如系统推荐等等。
简单的讲,就是挖掘出客户喜欢的相同商品,来进行相似物品的推荐。另外区
分客户群体,从而使我们更好的为客户服务。下面是KNN分类器构建实例。KNN的实现分训练和识别两步。训练时,把每
类样本降维后的结果作为KNN的输入。如图1所示,圆圈表示待识别数据所处的位置,选择K值为3时,选中实线圆中的3个数据,识别结果为三角形代表的类;选择K值为5时,选中虚线圆中的5个数据,识别结果为正方形代表的类。
2
f3
f4
f有实心的点组成了skyli
e集合。
图1一个skyli
e例子数据流足连续、实时、有序的数据项序列,数据流上的skyli
e查询是近来流数据挖掘领域的一项研究热点,它所独有的特征:数据实时到达、规模宏大、次序独立以及数据往往只能一次读取,要求数据流上的skyli
e查询处理算法必需高效地处理到达的每一个对象,并且具有较低的时间复杂度。但现有算法对数据的去除率不足,使得在进行skyli
e计算时对部分操作重复,造成时间和空问的浪费。并且在实际应用中,产生的数据流往往以分布式的形式出现,例如无线传感器网络中传感器r
好听全球资料 返回顶部