终极Hadoop大数据教程

包含 MapReduce、HDFS、Spark、Flink、Hive、HBase、MongoDB、Cassandra、Kafka 等的数据工程和 Hadoop 教程!

课程英文名:The Ultimate Hands-On Hadoop - Tame your Big Data!

此视频教程共17.0小时,中英双语字幕,画质清晰无水印,源码附件全

下载地址

课程编号:307
百度网盘地址:https://pan.baidu.com/s/1qGJzKMXtgKdVK77dcYR9Qw?pwd=r6r9
夸克网盘(不限速)地址:https://pan.quark.cn/s/03b693d077ec

课程内容

你将会学到的

  • 使用 Hadoop 和相关数据工程技术设计管理”大数据”的分布式系统。
  • 使用 HDFS 和 MapReduce 大规模存储和分析数据。
  • 使用 Pig 和 Spark 创建脚本,以更复杂的方式处理 Hadoop 集群上的数据。
  • 使用 Hive 和 MySQL 分析关系数据
  • 使用 HBase、Cassandra 和 MongoDB 分析非关系数据
  • 使用 Drill、Phoenix 和 Presto 交互式查询数据
  • 为您的应用选择合适的数据存储技术
  • 了解 YARN、Tez、Mesos、Zookeeper、Zeppelin、Hue 和 Oozie 如何管理 Hadoop 集群。
  • 使用 Kafka、Sqoop 和 Flume 将数据发布到 Hadoop 集群
  • 使用 Spark Streaming、Flink 和 Storm 使用流数据

本课程包括:

  • 14.5 小时 长的随选视频
  • 9 篇文章
  • 2 个可下载资源
  • 在移动设备和电视上观看
  • 结业证书

要求

  • 如果您想参加实践活动,您将需要使用基于 x86 且运行 64 位 Windows、MacOS 或 Linux 且具有 Internet 连接和至少 8GB 免费(非全部)RAM 的 PC,并且练习。如果您的 PC 不符合这些要求,或者您只有基于 M1 的 Mac,您仍然可以在不进行动手活动的情况下继续学习课程。
  • 有些活动需要一些编程经验,最好是 Python 或 Scala。
  • 对 Linux 命令行的基本熟悉将非常有帮助。

说明

Hadoop和”大数据”的世界 可能令人生畏 – 数百种不同的技术名称不详,形成了 Hadoop 生态系统。通过本 Hadoop 教程,您不仅会了解这些系统是什么以及它们如何组合在一起,而且您将亲身体验并学习如何使用它们来解决实际的业务问题!

在这门综合课程中学习和掌握最流行的数据工程技术,由亚马逊和IMDb的前工程师和高级经理教授。我们将超越 Hadoop 本身,深入研究您可能需要集成的各种分布式系统。

  • 使用Hortonworks(现在是 Cloudera 的一部分)和Ambari UI在您的桌面上安装和使用真正的 Hadoop 安装
  • 使用HDFS和 MapReduce管理集群上的大数据
  • 使用Pig和Spark编写程序来分析 Hadoop 上的数据
  • 使用Sqoop、Hive、MySQL、HBase、Cassandra、MongoDB、Drill、Phoenix和 Presto存储和查询您的数据
  • 使用 Hadoop 生态系统设计真实世界的系统
  • 了解如何使用YARN、Mesos、Zookeeper、Oozie、Zeppelin和Hue管理您的集群
  • 使用Kafka、Flume、Spark Streaming、Flink和Storm实时处理流数据

Spark 和 Hadoop 开发人员非常看重拥有大量数据的公司;这些都是非常值得学习的技能。

几乎每家您可能想工作的大公司都以某种方式使用 Hadoop,包括 Amazon、Ebay、Facebook、Google、LinkedIn、IBM、Spotify、Twitter 和 Yahoo!需要 Hadoop 的不仅仅是科技公司;甚至纽约时报也使用 Hadoop 来处理图像。

本课程内容全面,在超过14 小时的视频讲座中涵盖超过 25 种不同的技术。它充满了动手活动和练习,因此您可以获得一些使用 Hadoop 的真实经验——这不仅仅是理论。

您会在本课程中找到适合各个级别人员的一系列活动。如果您是一个只想学习流行语的项目经理,那么课程中的许多活动都有 Web UI,不需要编程知识。如果您对命令行感到满意,我们也会向您展示如何使用它们。如果您是程序员,我将挑战您使用Scala、Pig Latin和Python在 Hadoop 系统上编写真正的脚本。

您将从本课程中走出来,对 Hadoop 及其相关的分布式系统有一个真实而深刻的理解,并且您可以将 Hadoop 应用于现实世界的问题。最后还有一份珍贵的结业证书等着你! 

请注意,本课程的重点是应用程序开发,而不是 Hadoop 管理。尽管您将在此过程中学到一些管理技能。

对于当今的顶级科技雇主来说,知道如何处理”大数据”是一项非常有价值的技能。不要被抛在后面——现在就报名吧!

  • “终极实践 Hadoop……对我来说是一个重要的发现。我用大量文献和会议补充了你的课程,直到我设法获得了面试机会。我可以自豪地说我找到了一份大数据工程师的工作在我开始您的课程大约一年后。非常感谢您提供的所有精彩内容和清晰的解释。” – Aldo Serrano
  • “老实说,如果没有这门课程,我不会是现在的我。弗兰克通过帮助你完成整个过程的每一步,让复杂变得简单。强烈推荐,值得你花时间,尤其是 Spark 环境。这门课程帮助我取得了很大的成就对环境及其功能有更深入的了解。Frank 通过帮助您完成整个过程的每一步,让复杂变得简单。强烈推荐并值得您花时间,尤其是 Spark 环境。” – 泰勒-巴克

此课程面向哪些人:

  • 想要了解更大的 Hadoop 生态系统并使用它来大规模存储、分析和出售”大数据”的软件工程师和程序员。
  • 想要了解 Hadoop 术语和高级架构的项目、程序或产品经理。
  • 对 Hadoop 及其与他们的工作有何关系感到好奇的数据分析师和数据库管理员。
  • 需要了解 Hadoop 生态系统中可用组件以及它们如何组合在一起的系统架构师。