编辑:孙老师
QQ:328334283
电话:0411-84708445
邮箱:
本教材包括12章,每个章节包括理论任务和实践任务,理论联系实际.本教材主要介绍大数据技术概述、Hadoop初体验、Hadoop分布式文件系统、Hadoop分布式计算框架、Hadoop分布式数据库HBase、NoSQL 数据库、数据仓库Hive、大数据采集、Spark技术、数据可视化、Python数据分析;除此之外,还包括使用Python对房屋价格进行预测分析和通过日志数据分析用户行为两个综合案例.读者在学习大数据技术的同时,可学会真正使用大数据技术解决问题,增强大数据实战能力.
第1章 大数据技术概述 1
1.1 理论任务:认识大数据 1
1.1.1 大数据概念 1
1.1.2 大数据处理的关键技术 4
1.1.3 大数据软件 5
1.2 实践任务:大数据实验环境 7
1.2.1 安装虚拟机、Linux系统 8
1.2.2 Linux常用命令 22
第2章Hadoop初体验25
2.1 理论任务:初识Hadoop 252.2 实践任务:Hadoop安装与配置 36
第3章 Hadoop分布式文件系统 51
3.1 理论任务:了解HDFS 513.2.2 使用JAVA API与HDFS交互 63
第4章 Hadoop分布式计算框架 83
4.1 理论任务:认识MapReduce834.2 实践任务:MapReduce应用开发 90
第5章 Hadoop分布式数据库HBase 103
5.1 理论任务:认识HBase 1035.2.3 HBase编程 120
第6章 NoSQL数据库 131
6.1 理论任务:了解NoSQL数据库 1316.2.2 MongoDB的安装和使用 144
第7章 数据仓库Hive 155
7.1 理论任务:认识Hive 1557.2.2 HiveQL常用操作 167
第8章 大数据采集 171
8.1 理论任务:了解大数据采集工作 1718.2.3 Kafka安装及使用 194
第9章 Spark技术 199
9.1 理论任务:认识Spark 1999.2.2 Spark Shell使用 206
第10章 数据可视化 211
10.1 理论任务:了解数据可视化 21110.2.2 D3可视化库的使用方法 225
第11章 Python数据分析 231
11.1 理论任务:了解Python数据分析 23111.2.4 Phthon机器学习工具包的安装和使用 250
第12章 综合案例 251
12.1 综合案例1:使用Python对房屋价格进行预测分析 25112.2 综合案例2:通过日志数据分析用户行为 257
参考文献 272
大数据技术实战教程——课件
扫码关注
返回顶部