Hadoop大数据开发技术入门插图

课程简介

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)和(Google MapReduce的开源实现)为核心的

Hadoop为用户提供了系统底层细节透明的分布式基础架构。HDFS的高容错性、高伸缩性等优点允许用户将Hadoop部署在低廉(low-cost)的硬件上,形成分布式系统;

MapReduce分布式编程模型允许用户在不了解分布式系统底层细节的情况下并发并行应用程序。所以用户可以利用集群的Hadoop轻松地组织计算机资源,

从而搭建自己的分布式计算平台,并且可以充分利用集群的计算和存储能力,完成海量数据的处理。

Hadoop是一个开源框架,可编写和运行分布式应用处理大规模数据。分布式计算是一个宽泛并且不断变化的领域。

方便:Hadoop运行在由一般商用机器构成的大型集群上,或者云计算服务上,比如EC2。

健壮:Hadoop致力于在一般商用硬件上运行,其架构假设硬件会频繁失效,Hadoop可以从容地处理大多数此类故障。

可扩展:Hadoop通过增加集群节点,可以线性地扩展以处理更大的数据集。

简单:Hadoop允许用户快速编写高效的并行代码。

Hadoop框架的核心是HDFS和MapReduce。其中 HDFS 是分布式文件系统,MapReduce 是分布式数据处理模型和执行环境。掌握了这两部分,也就掌握了Hadoop最核心的东西。

课程目录

  • 课时1Hadoop起源介绍.mp4
  • 课时2Hadoop生态圈介绍.mp4
  • 课时3Hadoop基本组件介绍.mp4
  • 课时4Hadoop组成框架介绍.mp4
  • 课时5Hadoop安装.mp4
  • 课时6Eclipse环境搭建.mp4
  • 课时7HDFS组件及备份机制介绍以及读写文件流程介绍.mp4
  • 课时8Shell命令介绍.mp4
  • 课时9HDFS Java API介绍(一).mp4
  • 课时10HDFS Java API介绍(二).mp4
  • 课时11HDFS新特性介绍.mp4
  • 课时12YARN组件介绍以及YARN框架上job执行流程介绍.mp4
  • 课时13MR编程模型总体介绍.mp4
  • 课时14Shuffle阶段Map端执行流程介绍.mp4
  • 课时15Shuffle阶段Reduce端执行流程介绍.mp4
  • 课时16WordCount案例总体介绍.mp4
  • 课时17MapReduce中数据类型介绍.mp4
  • 课时18MR中自定义数据类型编写.mp4
  • 课时19案例介绍以及类的编写.mp4
  • 课时20Shuffle组件Partitioner自定义介绍.mp4
  • 课时21Shuffle组件Combiner以及Grouping自定义介绍.mp4
  • 课时22二次排序实现.mp4
  • 课时23顺序式MR组合任务介绍.mp4
  • 课时24依赖关系组合式MR任务介绍.mp4
  • 课时25链式MR任务介绍.mp4
  • 课时26MapSideJoin介绍.mp4
  • 课时27ReduceSideJoin介绍.mp4
  • 课时28半连接介绍.mp4
  • 课时29倒排索引实现.mp4

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系客服并提供付款信息为您处理。

本站资源均为虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好是您所需要的资源。