龙源期刊网httpwwwqika
comc
盲目冒进:机器学习的5个失败案例
作者:BobVioli
oCharles来源:《计算机世界》2018年第50期
机器学习也可能会出现严重错误,让你后悔当初的冲动。
机器学习是如此热门的一类技术,以至于太多的业务和技术主管们急于知道自己的部门怎样才能投身其中。如果做得好,机器学习能够帮助你创建更高效的销售和营销活动,改进财务模型,更容易发现欺诈行为,更好地对设备进行预测性维护,等等。
但是机器学习也可能会出现严重错误,让你后悔当初的冲动。本文借鉴真实企业在机器学习上的实际经验,介绍机器学习可能出错的5种方式。他们公开了自己的经验教训,希望能帮助你不再重蹈覆辙。
第1个教训:错误的假设会让机器学习出现偏差
ProjectorPSA是一家设计和构建专业服务自动化软件的美国公司,帮助咨询公司经营其业务,该公司在试图使用机器学习来预测人员配置计划中的差异时,苦涩地吸取了这一教训。
咨询公司的员工都是训练有素的专业顾问,希望能高效地发挥其人才优势,所以公司经常雇佣项目经理来评估并预测其项目的人员需求。
然后,他们跟踪顾问在每个项目上花费的时间,按照时间为客户计费。如果公司采用专业服务自动化工具等单一系统来管理所有活动,则有一些明显的优点,例如能够将预测的时间与实际时间进行比较,从而知道不同的项目经理在规划的准确性方面做得怎么样。
首席运营官SteveCho
g介绍说,ProjectorPSA已经开始和一家客户开展了一项研究,该客户聘用了数百名项目经理。他们建立了模型,在规划期(方差)不断增加的情况下,比较了平均实际工作时间与预测工作时间之间的差异。还研究了在这几个月的过程中,项目经理们预测的一致性(差异性)。
也就是说,如果在一周内预测值太高而下一周预测值太低(高差异性),那么ProjectorPSA想知道这些因素是否相互抵消,使得平均差异很小,或者方差很低。
Cho
g说:“开始时认为低方差和低差异好,而高方差和高差异不好。”基于这一前提,ProjectorPSA让一种机器学习算法根据这些数据,使用公司项目经理的样本作为训练集,把项目经理分成不同的组,例如“囤积者”和“乐观者”。
f龙源期刊网httpwwwqika
comc
然后,公司让机器学习算法根据所学到的知识对其他的项目经理进行分类。结果发现,机器学习将一些经验最丰富、训练最有素的项目理归类为最糟糕的违规者因为他们具有很高的方差和差异性。
Cho
g说:“事实上,这些项目经理是被公司指派参加那些已经处于困境的项目,r