捷创建大量描述数据基本特征的互动性图表;②具有关联分析类算法,可快捷挖掘数据中的关联规则和关联信息;③可以进行数据的切片、切块等数据透视操作。(2)数据获取与组织功能①具有较强的数据格式兼容性,即可以从多种不同类型的数据源或不同格式的数据文件中访问、读取数据;②具有便捷的数据清洗功能,可删除或替换无效数据,自动填充缺失值或减少无效数据;③具有数据分析最常用的高级排序和高级筛选功能,以及常用的统计分析功能如聚类分析等;④可以将组织的数据及数据挖掘项目、分析结果等输出为多种不同格式的文件或视图,以供不同的软件访问和读取。(3)数据预处理数据预处理指从文件、URL或数据库中加载数据集,并且根据应用要求或领域知识过滤掉不需要进行处理或不符合要求的数据。①加载数据,系统对本地数据文件或网络数据进行下载
2
f②保存数据,用户可将已加载的数据保存为系统支持的所有文件格式,该功能适合用于文件格式转换③数据信息总结,加载数据后,数据预处理模块将对当前数据集的信息进行总结,形成文件关系子面板(4)数据挖掘建模功能应至少具备以下数据挖掘与大数据分析算法与模型:①异常值检测算法②关联分析算法③决策树算法④回归分析建模与算法⑤最近邻建模和评分算法⑥神经网络算法⑦各种回归模型算法⑧序列关联算法⑨时间序列建模与算法(5)模型或算法评估功能①能够利用大量的数据挖掘算法选择最佳数据分析算法模型和分析结果;②具有交互式模型浏览模块,能够进行可视化结果输出,进行可视化结果分析;二、物流大数据创新实验平台物流大数据分析与挖掘实验,基于目前的数据集,开发设置了仓储、运输、供应链领域的多个创新实验方向,并基于大数据应用路径的递进关系,形成了三级实验项目。1三级创新实验项目设计Level1数据认知:初步认知与统计能够利用工具,实现对数据的认知,能够实现基本的数据统计,能够理解数据的基本规律,能够实现基本的可视化图表制作。Level2业务分析:规则发现能够利用分类、聚类、关联规则等数据挖掘方法,洞察复杂数据之间
f的逻辑关系,分析业务运作的潜在规律,提出问题并创新解决方案。Level3运营决策:复杂系统决策能够利用自主创新模型和算法,解决复杂系统的优化与决策。2创新实验项目的设置21仓储领域211仓储作业优化level1:仓储作业EIQ分析实验项level1:仓储作业运营可视化实验项目level2:商品分类聚类实验项目level2:仓储作业规律分r