全球旧事资料 分类
策略:减法、加法,先加后减、先减后
加策略。a减法策略:以具体例子为出发点,对例子进行推广或泛化,推广即减
除条件(属性值)或减除合取项(为了方便,我们不考虑增加析取项的推广),使推广后的例子或规则不覆盖任何反例。b加法策略:起始假设规则的条件部分为空(永真规则),如果该规则覆盖了反例,则不停地向规则增加条件或合取项,直到该规则不再覆盖反例。c先加后减策略:由于属性间存在相关性,因此可能某个条件的加入会导致前面加入的条件没什么作用,因此需要减除前面的条件。d先减后加策略:道理同先加后减,也是为了处理属性间的相关性。典型的规则归纳算法有AQ、CN2和FOIL等。
4数据挖掘的聚类方法有哪些,请详细阐述之数据挖掘的聚类方法1)、划分方法(Partitio
i
gMethods)给定一个有
个对象的数据集,划分聚类技术将构造数据k个划分,每一个划分就代表一个簇,k
。也就是说,它将数据划分为k个簇,而且这k个划分满足下列条件:
a每一个簇至少包含一个对象。b每一个对象属于且仅属于一个簇。对于给定的k,算法首先给出一个初始的划分方法,以后通过反复迭代的方法改变划分,使得每一次改进之后的划分方案都较前一次更好。1)、层次聚类层次聚类方法对给定的数据集进行层次的分解,直到某种
f条件满足为止。具体又可分为:a凝聚的层次聚类:一种自底向上的策略,首先将每个对象作为一个簇,
然后合并这些原子簇为越来越大的簇,直到某个终结条件被满足。b分裂的层次聚类:采用自顶向下的策略,它首先将所有对象置于一个
簇中,然后逐渐细分为越来越小的簇,直到达到了某个终结条件。层次凝聚的代表是AGNES算法。层次分裂的代表是DIANA算法。2)密度聚类方法密度聚类方法的指导思想是,只要一个区域中的点的密
度大于某个域值,就把它加到与之相近的聚类中去。代表算法有:DBSCAN、OPTICS、DENCLUE算法等。3)其它聚类方法STINGStatistaicalI
formatio
Grid_basedmethod是一种基于网格的多分辨率聚类技术,它将空间区域划分为矩形单元。STING算法采用了一种多分辨率的方法来进行聚类分析,该聚类算法的质量取决于网格结构最低层的粒度。如果粒度比较细,处理的代价会显著增加;但如果粒度较粗,则聚类质量会受到影响。
5.请阐述数据挖掘的基本过程及步骤
一、业务理解:业务理解包括确定商业对象、了解现状、建立数据挖掘目标和制定计划书。应该是对数据挖掘的目标有一个清晰的认识,知道利润所在,其中包括数据收集、r
好听全球资料 返回顶部