全球旧事资料 分类
分词、信息存储方式、马尔可夫模型等的研究,来实现一个可以及时、准确的舆情监测和预测系统,为相关领域的工作人员提供数据上的支持。
2网络舆情监测系统需求分析(Requireme
tsa
alysisofthe
etworkpublicopi
io
mo
itori
gsystem)
f龙源期刊网httpwwwqika
comc
运用互联网平台进行交流具有匿名、及时、参与程度广、影响面宽、破坏面大等特点,这些特点给舆情监督的工作人员带来了极大的困难和挑战。因此,国内外普遍重视舆情监测关键技术的研究,目前,舆情监测涉及的技术非常多,其核心多为网络信息抓取技术、网络信息提取技术、自然语言处理技术。其中,网络信息抓取技术多指利用网络爬虫工具进行信息抓取工作7网络信息提取技术则指将文本里的信息进行结构化处理,多被处理为表格形式8自然语言处理技术主要研究人与计算机交互的语言问题,通过分词、关键词提取等一系列操作对舆情状况进行分析,从而达到舆情监测的目的。
国内对网络舆情的监测起步较晚,又由于中西文的差异造成中文分词技术、文本挖掘技术等许多先进技术无法借鉴,同时研究机构与应用机构又严重脱节,直接导致我国的舆情产品比较昂贵同时发展也较为迟缓。不过,随着电子计算机和互联网络在中国的普及,网络舆情对社会生活的影响越来越大,网络舆情监控的产品也越来越多,其中以网智天元、北大方正、西盈信息、人民网舆情为代表的软件公司纷纷推出了自己的产品,并且都实现了24小时实时监控、关键词监测设置、舆情分析报告等基本功能。虽然国内的软件可以完成对网络舆情的监测任务,并且提供完整的分析报告,但是还没有提供对于舆情事件的趋势预测功能。
3网络舆情监测系统概要设计(Overviewof
etworkpublicopi
io
mo
itori
gsystem)
31系统总体功能介绍
网络舆情监测系统主要由舆情数据处理系统和舆情趋势预测系统两个部分组成,在舆情数据处理系统中,又包括信息采集、信息处理、关键词提取等模块。系统的功能模块图如图1所示。
系统采用CS和BS相结合结构进行设计,CS客户端主要负责自动采集指定网站上的信息,并且对信息进行过滤和分析,最后对信息进行存储BS系统主要用于数据展现、数据查询以及舆情趋势预测等功能,系统的架构图如图2所示。
32系统数据流程图
系统的数据流来自采集模块,从自定义的采集网站中开始采集网络信息,采集的结果直接通过信息过滤模块,将用户所需信息从采集的网页源代码中分离出来,保存到本地数据库。随后,关键词提取模块读取采集信息的正文,r
好听全球资料 返回顶部