大数据综合实践

课程简介

一、课程基本信息

  • 课程名称:大数据综合实践
  • 授课对象:数据科学与大数据专业 2022级大三学生
  • 授课教师:王倩倩
  • 授课学期:2024至2025学年度第2学期
  • 教材:《大数据综合应用实践》,陈静等编著,清华大学出版社,2022年第1版

二、课程教学目标

  • 学生能够掌握Hadoop、HBase、Spark、Hive、MySQL、Kafka等大数据相关技术的集群安装与部署方法。
  • 学生能够熟练运用大数据技术进行数据生产、采集、清洗、存储、分析和可视化等操作。
  • 学生能够理解大数据综合应用项目的完整流程,并具备一定的项目实践能力。
教师简介

王倩倩,女,工学博士,副教授,硕士研究生导师。2017年6月在南昌大学获得电子信息工程专业工学学士学位,2022年6月在华南理工大学获得信息与通信工程专业工学博士学位。2021.04-2022.04期间,以国家公派联合培养博士生身份在加拿大英属哥伦比亚大学应用科学系工程学院进行学术访问。主要从事医疗物联网、植入式超声通信技术相关领域的研究,先后在IEEE Transactions on Communications、IEEE Transactions on Molecular, Biological and Multi-Scale Communications、IEEE Communications Letters等权威期刊,以及IEEE ICC、IEEE GLOBECOM等国际知名会议上发表学术论文20余篇,并担任IEEE Transactions on Communications、Computer Networks等国际期刊审稿人。授权中国发明专利5件,授权美国专利1件,公开PCT专利2件。主持国家自然科学基金青年科学基金1项,主持甘肃省青年科技基金1项,主持广东省短距离无线探测与通信重点实验室开放课题1项。

先导课程
教学计划

时间

周次

教学内容

备注

2025.2.23-2025.3.1

1

实验一 Hadoop集群安装与部署

 

2025.3.2-2025.3.8

2

实验一 Hadoop集群安装与部署

实验报告一

2025.3.9-2025.3.15

3

实验二 ZooKeeper、HBase集群安装与部署

 

2025.3.16-2025.3.22

4

实验二 ZooKeeper、HBase集群安装与部署

实验报告二

2025.3.23-2025.3.29

5

实验三 Spark、Hive集群安装与部署

实验报告三

2025.4.6-2025.4.12

7

实验四 MySQL、Kafka集群安装与部署 实验报告四

2025.4.13-2025.4.19

8

期中考核 可视化分析

课程设计一
考试方式

平时成绩 60%

       实验报告 40%

       期中考核 10%

       课堂考勤 10%

期末考核 40%

       小组汇报 10%

       课程设计 30%

参考书目