班级:12级数师2班姓名:谭栖希学号:201202024090
f基于微博用户行为的数学建模和数学分析
摘要:微博作为一种新兴的交流工具,以简单快捷的操作方式、随时随地发布信息的
互动形式在各类网络社交服务中独树一帜。本问针对不同的微博问题,提出了不同的模型和算法,过程如下:问题一与问题二都是利用Excel进行综合评价模型,根据数据分析,对问题定义合适的影响因子,对不同的影响因子用极值差方法做标准化处理,得到合理的数据,使评价结果更为合理。采用组合赋权法,得到更加合理的权数,使用线型加权综合评价法得到最后的评价结果,利用Excel得到问题答案。问题三通过图论分析算法将
个人看作
个顶点,将相互关注的好友连接起来,建立无向的图即为好友圈,通过深度优先扫描的Tarja
算法判断是否是无向连通图,通过广度优先算法找出连通的最大图即为最大好友圈,求出最大连通图中的边数e,通过得到的变数e找出最大连通图的顶点数,则找到最大好友圈的人数。问题四通过本题对大V的定义从而我们知道影响力越到的大V那么他传播消息的能力则越强,则传播的图就越大,从而我们先找出影响力最大的大V,依次从往小的剔除数据,建立新的邻接矩阵。当去到一定的数据时,对数据通过回归分析拟合得到了关于剔除人数和对于大V之间的函数关系,从而解出所需要传播发布消息的最少人数。
关键字:综合评价模型、图论分析算法、回归分析
一、问题重述
微博,作为互联网上的新兴应用,由于智能手机的普遍,使得其御用变得极其方便,从而吸引了大量的注意力。涉及微博的很多应用问题,是值得大家注意和思考的。通常微博用户的群体数量巨大,使得如下问题的计算变得极其复杂,为了便于考虑问题,使得计算在普通的微机上也可行,我们分别考虑有2000个用户和10000个用户
1
f的问题,数据文件data1xls和data2xls包含了这些用户的相互关注数据,每一行为该行号对应的用户对其它用户的关注信息。数据文件data3xls和data4xls为若干消息数据,每一行为用户发布或转发的消息编号。现在我们来解决如下问题:问题一:在微博群体中,有的人受关注度很高,他们被称为大V。由于受关注度很高,他们发微博的影响力就很大,我们需要通过已知数据对大V定义合适的影响因子,并通过影响因子找出最具有影响力的十个大V。问题二:每天更新的微博消息有很多,但被大量的用户转发和关注的却很少,消息的影响力不同。消息的影响力与发消息的人有关,因此,我们将通过比较r