全球旧事资料 分类
读懂概率图模型:你需要从基本概念和参数估计开始
选自statsbot作者:Prasoo
Goyal机器之心编译参与:Pa
da概率图模型是人工智能领域内一大主要研究方向。近日,Statsbot团队邀请数据科学家Prasoo
Goyal在其博客上分两部分发表了一篇有关概率图模型的基础性介绍文章。文章从基础的概念开始谈起,并加入了基础的应用示例来帮助初学者理解概率图模型的实用价值。机器之心对该文章进行了编译介绍。第一部分:基本术语和问题设定机器学习领域内很多常见问题都涉及到对彼此相互独立的孤立数据点进行分类。比如:预测给定图像中是否包含汽车或狗,或预测图像中的手写字符是0到9中的哪一个。事实证明,很多问题都不在上述范围内。比如说,给定一个句子「Ilikemachi
elear
i
g」,然后标注每个词的词性(名词、代词、动词、形容词等)。正如这个简单例子所表现出的那样:我们不能通过单独处理每个词来解决这个任务「lear
i
g」根据上下文的情况既可以是名词,也可以是动词。这个任务对很多关于文本的更为复杂的任务非常重要,比如从一种语言到另一种语言的翻译、文本转语音等。使用标准的分类模型来处理这些问题并没有什么显而易见
f的方法。概率图模型(PGMprobabilisticgraphicalmodel)是一种用于学习这些带有依赖(depe
de
cy)的模型的强大框架。这篇文章是Statsbot团队邀请数据科学家Prasoo
Goyal为这一框架编写的一份教程。在探讨如何将概率图模型用于机器学习问题之前,我们需要先理解PGM框架。概率图模型(或简称图模型)在形式上是由图结构组成的。图的每个节点(
ode)都关联了一个随机变量,而图的边(edge)则被用于编码这些随机变量之间的关系。根据图是有向的还是无向的,我们可以将图的模式分为两大类贝叶斯网络(Bayesia
etwork)和马尔可夫网络(Markov
etworks)。贝叶斯网络:有向图模型贝叶斯网络的一个典型案例是所谓的「学生网络(stude
t
etwork)」,它看起来像是这样:这个图描述了某个学生注册某个大学课程的设定。该图中有5个随机变量:课程的难度(Difficulty):可取两个值,0表示低难度,1表示高难度学生的智力水平(I
tellige
ce):可取两个值,0表示不聪明,1表示聪明学生的评级(Grade):可取三个值,1表示差,2表示中,3表示优
f学生的SAT成绩(SAT):可取两个值,0表示低分,1表示高分在完成该课程后学生从教授那里所得到的推荐信的质量(Letter):可取两个值,0表示推荐信不好,1表示推荐信很好该图中的边编码了这些变量r
好听全球资料 返回顶部