全球旧事资料 分类
的页面相重合的关联度,当这个关联度达到了某个数值时的页面的合集1718。常用的算法有Aprior,对于事物数据库,当遇到一个最大的访问项集,就会将其挖掘出来,这个项集就是依靠Web数据挖掘技术关联规则实现得到的用户访问模式。42序列模式挖掘技术在关联规则挖掘技术当中增加一项时间属性,可以用了明确事物的先后顺序,预测事物的发展趋势,这就是序列模式挖掘。这种挖掘是页面之间的关系模式,也就是说页面之间有先后的关系。从用户的访问序列当中挖掘出来有关的规则是时序模式发现的目的。一段时间内的用户访问行为会被服务器所记录,数据预处理时,各个事物也会有时间记录。根据时间序列分析,可以达到预测用户访问行为的目的,比如,用户购买了物品A,在一定的时间内,他有百分之七十的可能性会购买物品B,这样的话就可以对其投放特定的广告。43分类技术分类的原则就是根据某些特性,将数据库中的数据进行分类11。在Web挖掘技术当中,比如在线购买中,可以得出购买人群主要是2030岁的青年人群,就可以针对这个年龄段人群的特点展开商务活动。当前,最经典的分类方法就是决策树方法。44聚类技术聚类就是将数据库中的数据根据某个相似性划分为各个不同的类别,对符合某一访问规律特征的用户进行用户特征挖掘。45路径分析技术图是Web数据挖掘时用路径分析技术最常用的。图是指GVE,其中V是结点集合,E是边集合,结点之间用有向边连接。对于Web挖掘应用,将页面作为顶点集合,E作为有链接关系的有向边集合,入边是被引用,出边是引用,这样就形成了网站的结构图。对于图中的访问路径,最优访问路径就是指对于已经确定的点之间找到一种符合条件的某个量度最小的访问路径。
8
f河南师范大学本科毕业论文
5案例分析
近年来,我国房地产市场持续火爆,房价成了我国全民关心的话题。为了防止一些发达国家历史上出现过的房地产泡沫,国家屡次出台有关房价问题的政策,持续加大对房地产的调控的力度。因为房地产关乎民生,所以很多网民都在互联网上发表了自己对政府调控房价政策等方面的看法,这就是房地产网络舆情。对于这些网络舆论情况进行分析,可以对其进行有效的控制和疏导网络舆情分析的步骤如下:51信息采集有关房地产网络舆情的信息采集主要是通过网络爬虫来对网络内容进行抓取。数据的获取主要从这几个方面着手,对列表页进行抓取、相关链接和对下载的详情页面。可以通过内容获取模块、内容分析模块、r
好听全球资料 返回顶部