第一章Hadoop生态系统及运行MapReduce任务介绍!

摘要:我们生活在大数据时代,企业日常需要处理的数据量超出了单个主机的存储和处理能力。大数据带来了两大基本挑战:存储和处理大量数据以及理解数据并将其转化为竞争优势。通过高效存储和计算能力,Hadoop的出现填补了市场空白。目前,Hadoop已经成为大数据领域的事实标准,被Yahoo、Facebook、Twitter、阿里巴巴、百度等大型企业采用,并且正在进军所有领域...【阅读原文】

第二章Yarn基本原理及使用介绍
本章主要介绍如何从命令行开始使用Yarn以及解决使用资源调度过程中遇到的各种问题。一旦你开始了解Yarn,就会发现MapReduce是如何被重写为YARN应用程序的(MapReduce 2或MRv2),并了解MapReduce的体系结构更改。
第三章MapReduce介绍
第四章HDFS
相关阅读