2019年全国职业院校技能大赛赛项规程
一、赛项名称
赛项编号:GZ2019032赛项名称:大数据技术与应用英文名称:BigDataTech
ologyA
dApplicatio
赛项组别:高职组赛项归属:电子信息大类
二、竞赛目的
为贯彻落实国务院发布的《促进大数据发展行动纲要》和工业和信息化部发布的《大数据产业发展规划(20162020年)》。加快实施国家大数据战略,推动大数据产业健康快速发展,针对高职“大数据技术与应用”专业建设和发展的需求,通过引入大数据各个环节的实际应用场景,全面考察高职学生大数据技术基础、软件开发相关技术、Hadoop及其生态组件部署与管理、数据采集、数据清洗、数据分析和数据可视化等前沿的知识、技术技能以及职业素养和团队协作能力。
赛项围绕大数据产业各个岗位的实际需求和要求进行设计,通过大赛搭建校企合作的平台,深化产教融合,推进产教融合人才培养模式,提升大数据技术与应用专业及其他相关专业毕业生能力,同时大赛促进相关教材、资源、师资、认证、实习就业等全面建设,推动院校和企业联合培养大数据人才,加强学校教育与产业发展的有效衔接,促进职业院校信息类相关专业共同发展,为国家战略规划提供大
1
f数据领域的高素质技能型人才。
三、竞赛内容
赛项以大数据技术与应用为核心内容,重点考查参赛选手基于Hadoop平台环境下,利用Hadoop技术生态组件,综合软件开发相关技术,解决实际问题的能力,具体包括:1掌握按照项目需求配置管理Hadoop大数据平台及相关生态组件;2掌握企业常用采集工具和网络爬虫的相关技术,完成指定数据的
采集及处理能力;3综合利用MapReduce、Spark、Storm等技术、分布式存储系统、
数据仓库Hive等工具,使用Java、Pytho
等开发语言,完成数据清洗、存储、转化、分析及数据推送等一系列大数据操作;4综合运用HTML、CSS、JavaScript、Pytho
等开发语言,对数据进行可视化呈现;5根据数据可视化结果,完成数据分析报告的编写;6竞赛时长4小时,竞赛连续进行。竞赛内容构成如下:
考核环节
考核知识点和技能点
描述
Hadoop平台安装部署和基本配置
Hadoop平台及组Hadoop集群节点的动态增加与删除件的部署管理Hadoop平台相关组件部署与管理
Hadoop平台的高可用
考察Hadoop平台及组件的部署能力,掌握常用的基本配置和命令,能够部署和管理Hadoop高可用集群。
数据采集
使用开发者工具查看网页源码,分析网
页结构,明确数据采集对象
考察学生多维度数据
构建数据采集请求,抓取网络数据采集能力,包括对r