全球旧事资料 分类
数据挖掘在微博营销的应用特征行为分析模块
学院计算机科学与技术学院
专业网络工程
学生姓名XX
学号XXXXXX
指导教师姓名XXXXX
2013年6月20日
f数据挖掘关于微博营销的应用
特征行为分析模块摘要
随着新浪微博用户群体的增长新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率获取JSON对象并解析实现高效数据获取。同时将传统的网络爬虫结合网页解析技术结合API同时使用解决了因API接口开放不完善且因在返回结果数量上限与调用频率方面的限制导致不能有效实现新浪微博数据的全面获取的问题。经过实验测试通过2套方案的结合可以实现新浪微博数据高效全面的获取。
通过对微博用户的信息和关系数据进行决策树分析、相关性分析和关联规则来挖掘用户特征并对微博网络进行核心用户发掘。结果表明微博中的名人具有关注数小被关注数大的特征用户趋向于通过关注他人和积极发布微博文章两种方法来提高被关注度愿意公布性别或自我描述的用户通常愿意公布地址和发布博文而不愿意公布地址、性别或自我描述的用户通常不愿意公布其他两项对微博网络进行核心用户挖掘并进行个性化营销是可行的。
f目录
1引言1
2数据挖掘的概述1
21数据挖掘的概念1
22数据挖掘的常用技术2
23数据挖掘应用的交易的运营模式4
3社交网络与商业应用5
31社交网络应用的迅猛发展5
32微博营销与数据挖掘关系6
4商业智能系统在电子商务中的应用分析6
1研究设计6
2实证研究7
5对电子商务交易模式综述12
1基于API的数据获取12
2基于网络爬虫的页面解析18
3数据分析21
总结22
主要参考文献23
f1引言
微博作为Web20时代新生网络应用形式在最近几年中得到了迅猛的发展。新浪微博中一条用户状态限定280字符的内容长度不但更适合现代社会快速生活节奏的需要而且也更方便用户通过移动通信终端上传和分享自己感兴趣的微博信息。在美国微博网站Twitter自2006年创建以来用户数量在近几年中突飞猛进其中2009年Twitter的用户增长率达到2565是社交网站Facebook与Li
kedI
增长率总和的10倍。在中国已有14的互联网用户开始使用微博而新浪微博的市场份额占有率接近87是中国微博产业的主导力量。
微博是一个基于用户关系的信息分享、传播以及获取平台用户可以通过网页WAP以及各种客户端组件登录到个人社区以140字左右的文字更新信息并实r
好听全球资料 返回顶部