全球旧事资料 分类
龙源期刊网httpwwwqika
comc
基于大数据分析下的机器学习模型设计方法
作者:陈强来源:《西部论丛》2018年第10期
摘要:随着科技和经济的持续进步,人工只能技术已经逐渐变成目前我们国家十分重视的对象之一。现如今我们国家已经进入了信息化时代,每个人在日常生活中都将接触到大量的信息资讯。早期的信息处理主要通过人工的方式,显然这一模式现如今已经显得十分过时,无法满足人们的正常需要。基于这一情况,大数据就此诞生,其能够直接从海量的数据资料中提取人们需要的内容,不仅高效,而且精确度高。而大数据本身有何机器学习之间有着非常重要的联系。为此,相关工作人员理应对于其模型设计方面提高重视。本篇文章将阐述机器学习模型的设计种类,并低于具体分类方面提出一些合理的见解。
关键词:大数据机器学习设计方法
引言
从现阶段发展而言,机器学习一直都属于人工智能技术中的一类,主要是指让电脑能够像人体的思维模式一样自主展开知识学习,以此提升数据的处理速度。这种方式能够有效帮助大数据平台完成分析的工作,并且提升计算的精确性和速率。
一、支持向量机
早在上世纪90年代,科学研究者便创建了支持向量机,又被称作SVM,其主要是一种全新的机器学习模型,具有很强的学习能力,能够自主完成知识分析和提取。当该模型刚一诞生,便立刻在智能科技领域中掀起了巨大的浪潮,引起了全球媒体的关注。这一模型主要是在VC维理论的基础上创建,并将结构风险最小原理融入其中。在实际操作的时候,将样本提供的数据作为基础点,以此可以在模型本身的复杂性特点以及学习能力之间能够找出其中存在的平衡点位置,进而确保其效果能够充分展现出来。由于当时还没有大数据存在,因此该模型往往能够在小样本、分线性以及高维模式中得以应用,以此完成识别、检测以及翻译的工作1。
目前来看,SVM可以算是全世界应用率最高的学习模型。例如在爱进行线性可分的问题处理时,其可以将其中间隔最大的一个平面提取出来,以此将两种完全不同的样本分开。该平面本身具有很强的泛化能力。线性不可分一直都是一种十分普遍的情况,因此经常由于对偶的问题导致目标函数难以确定。为了处理这一问题,通常需要采取两种方法,分别是软间隔优化以及核技巧。软间隔优化主要是依靠对于输入空间采取一定限制的方式,以此将一些简单的错误全部忽略。但是,如果有线性不可分的问题出现,这种方法的效果便无法发挥。而核技巧主要是通过寻找核函数的方式,r
好听全球资料 返回顶部