全球旧事资料 分类
数据库操作模块实现,以及分析和分解根。房地产网络舆情的信息选取的时间范围为2015年1月1日到2015年6月30日的有关房价调控的评论。对网上各有关房市讨论的热点话题共计抓取2340篇评论。评论者为社会各个行业的人士,除了国内的老百姓,还有海外人士。首先对这些评论采用分类的方式得到有效评论1800篇,其中正面评论1300篇,负面500篇。举例如下表:
表51正面、反面的评论正面的评论1、真是太好了,中央要抑制房价。2、说的有理,国家不断增长,有利于人民。3、政策一直在朝着好的方向发展,这是毋庸置疑的。4、能不能抑制房价,需要市场调节,国家一定能解决好这个问题。5、中国一直在不断向前发展,房价对于中国不是问题,我对国家有信心。6、国家一直在考虑民生问题,国家财政必将取之于民,用之于民。7、支持发改委,相信政府能够避免楼市泡沫。8、国家解决问题需要时间,相信政府定能在尽可能短的时间内解决全民炒房问题。负面的评论1、国家对房价这一重要问题都调控不好。2、发改委影响了中国前进的步伐。3、当前,地皮归政府管理,前景不容乐观。4、科学院真是不行,调控房价这么些年,也没能解决好这个问题。5、国家腐败太多,民生问题难以解决,唉,悲哀。6、国家政策失误导致了虚高的房价,应该出台正确的政策,弥补以前的失误,老百姓辛辛苦苦一辈子,还买不了一套房,真是悲哀。7、所谓的学者,你的知识在哪儿,一直在乱讲,也没个好方法,误导国民。8、为什么政府官员、老师总是宣扬一些不着调的话语,房价是关乎民生,政治的大问题。

52数据预处理首先对所提取的信息进行文本提取,也就是要去除除文本外的信息如视频,音频等;
9
f河南师范大学本科毕业论文
然后对文本进行分词的处理;最后对文本采用向量空间等方法进行特征表示,以及进行特征选择,得到有效的文本特征,为分析做准备。53文本内容分类对获得的网络舆论采取情感上的倾向性分析。在这个阶段,首先将数据与现有的网络情感倾向性方法进行对比,这些方法是:基于支持向量机的网络舆论情感分析方法,基于K阶最近邻方法的网络情感分析方法以及基于Ngram方法的网络情感分析方法。通过对比发现,选择基于支持向量机的网络舆论情感分析方法更合适。第一根据之前所得的舆情语科库对SVM进行训练,并将其用于房地产舆情分析预测当中。再对所收集的信息按照一个月分为两次的间隔分成10个时间段。进行分类预测。结果如下:
表52分类评论的r
好听全球资料 返回顶部