- A+
大数据基础Hadoop快速入门教程!
Hadoop生态概况
Hadoop是一个由Apache基金会所开发的分布式系统集成架构,用户可以在不了解分布式底层细节情况下,开发分布式程序,充分利用集群的威力来进行高速运算与存储,具有可靠、高效、可伸缩的特点,Hadoop的核心是YARN,HDFS,Mapreduce等。
课程介绍
从零开始搭建Hadoop集群环境,学习HDFS、MapReduce、Yarn、Hive
等Hadoop技术,通过知识点 + 案例教学法帮助小白快速掌握大数据Hadoop开发。
Hadoop实现了一个分布式文件系统,简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上;而且它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。本课程是大数据学科的入门教程,将会为您讲述hadoop的具体内容,对大数据感兴趣的一定不要错过!
适用人群
对大数据Hadoop感兴趣的在校生及应届毕业生。
对目前职业有进一步提升要求,希望从事大数据行业高薪工作的在职人员。
对大数据行业感兴趣的相关人员。
课程亮点
知识体系完备,从小白到大神各阶段读者均能学有所获。
生动形象,化繁为简,讲解通俗易懂。
结合工作实践及分析应用,培养解决实际问题的能力。
每一块知识点, 都有配套案例, 学习不再迷茫。
课程目录
第一章 大数据基础和Zookeeper入门
第二章 Zookeeper操作和Hadoop环境搭建
第三章 HDFS操作
第四章 HDFS的JavaAPI操作和MapReduce入门
第五章 MapReduce的WordCount案例和分区
第六章 MapReduce的排序和序列化
第七章 MapReduce的运行机制和join操作
第八章 MapReduce的其他操作和yarn
第九章 数仓Hive基本操作
第十章 数仓Hive的其他操作和调优