网络舆情分析系统的研究与设计摘要:网络舆情是指在一定的社会空间内,通过网络围绕中介性社会事件的发生、发展和变化,民众对公共问题和社会管理者产生和持有的社会政治态度、信念和价值观。随着科技的发展,政府迫切需要更好地监控与引导网络,本文通过研究现今网络舆情分析系统的技术特征,并根据需要,介绍了网络舆情分析系统的一种可行模型,能够提高网络舆情分析的准确性和灵活性,有效促进我国网络舆情分析工作的迅速发展。关键词:网络舆情;网页文本结构化;文本分类;文本聚类互联网的高速发展使网络信息越来越难以处理,所以,传统的以人工分类为基础的处理方式已完全不能够适应如此规模的网络信息量得处理工作。作为一个新的研究课题,对网络舆情的监控和分析,必须建立在高科技的现代信息技术当中,从而能够及时面对网络舆情并第一时间对其进行主动控制和疏导。一、网络舆情分析系统的总体模型概括网络舆情分析系统根据用户的不同需求,对特定种类的以网络为载体的新闻和消息在收集后通过网页净化、词频统计等手段对信息进行有效的预处理活动,并将预处理的所得结果入库,并通过数据挖掘算法对信息进行分析,最后会得到一定时期内网络所出现出现的热点信息,并对其进行追踪,得到事件的详细信息。11输入输出层面输入层指互联网搜索、数据源等。随着网络在获取信息方面的便捷性和灵活性的提高,许多信息平台,如博客、新闻和政府网站都成为网络舆情的监控源。输出层一般来说指的是前端展示输出,对于网络舆情分析系统来说,其输出程序主要根据用户需要提供信息,其信息的种类呈现出多样化的特点。12业务处理层面121网络舆情系统信息采集以及预处理方式网络舆情监控系统需要在了解用户需求的前提下,设定所需主题或目标,并利用人工和自动相结合的信息采集手段完成信息收集的任务。对于已经定位的网络资源,需要知道网络资源是否已进入数据库中,若己保存到数据库,系统需继续进行其他资源的收集。网络舆情信息预处理是网络舆情信息分析系统的准备阶段,能够对网页当中的信息进行数据清洗和分类处理后,形成格式化的数据然后上传到数据库,并进行信息过滤,滤除无关信息,保存重要信息。122网络舆情数据存储
f舆情数据存储主要包含数据入库、网页快照与附件存储等,舆情数据需要在收集后保存在相应的数据库中,并需要根据不同种类的信息类型,对数据库进行相应的分类。123网络舆情语义分析网络舆情r