全球旧事资料 分类
格。判别分析法最初是二十世纪五六十年代由Fisher提出的,其原理是根据观察到的一些统计数字特征,对客观事务进行分类,以确定事务的类别。判别分析方法要求通过历史上每个类别的若干样本,总结出分类的规律性,建立判别公式。
52逻辑回归
逻辑回归对于解释指标分布没有假设的严格限制,因此建立的个人信用模型具有相当的稳健性和数据处理的优越性;不限定特征变量的性质,比较适合于处理解释变量为离散变量或者是性别、职业、学历等定性变量;可以对每个变量分别进行显著性检验。因此,逻辑回归模型成为了设计个人信用评价模型的主要方法,并且延续至今。
53神经网络
神经网络是目前为止一个公认的较好的方法,但是神经网络也存在一些固有的缺点,主要在于:其对样本数量要求很高,不支持小样本数据;其网络结构难以确定,没有一个规范的模式来构造网络结构,每一次训练都需要大量人为随机调试,工作量很大;缺乏相关的统计理论基础,模型的结果对实际问题缺乏解释能力。
54决策树
决策树算法作为数据挖掘应用最广泛的分类方法之一,有着准确率高、简单、高效等优点,既能处理数值型的数据如“家庭收入”、“申请贷款额度”、“抵押品价值”等,也可处理“性别”、“学历”、“职业”等非数值型数据,因此适用于商业银行进行个人信用评级。决策树是Qui
la
在Hu
t的概念学习系统GLS(Co
ceptLear
i
gSystem)上发展起来的一种自顶而下的分类方法。它通过对一组训练样本的学习,构造出决策型的知识表示。决策树的每个内部节点表示在一个属性上的测试,每个分支代表一个测试输出,而每个树叶节点代表类或类分布,树的最顶层节点是根节点。对于一个新分类,样本的属性值在决策树上作测试。路径由根到存放该样本预测的叶结点,并把其结果转化为分类规则。
55支持向量机
支持向量机是一种基于结构风险最小化的非线性辨识方法,其推广能力很强,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,已在很多领域得到广泛使用支持向量机的基本思想是将输入空间的样本通过非线性变换映射到高维特征空间,然后在特征空间中求取把样本线性分开的最优分类
f面。支持向量机方法就是通过一个非映射p,把样本空间映射到一个高维乃至无穷维的特征空间中
(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。简单地说,就是升维和线性化。升维,就是把样本向高维空间做映射,一般情况下这会增加计算的复杂性,r
好听全球资料 返回顶部