PySpark大数据计算教程

了解如何将 Spark 与 Python 结合使用,包括 Spark Streaming、机器学习、Spark 2.0 DataFrames 等!

课程英文名:Spark and Python for Big Data with PySpark

此视频教程共4.0小时,中英双语字幕,画质清晰无水印,源码附件全

下载地址

课程编号:346
百度网盘地址:https://pan.baidu.com/s/1mCEdU86NEamaGifJimRVBw?pwd=jtdn
夸克网盘(不限速)地址:https://pan.quark.cn/s/c5d5641c9b94

课程内容

你会学到什么

  • 结合使用 Python 和 Spark 分析大数据
  • 了解如何使用新的 Spark 2.0 DataFrame 语法
  • 从事模拟现实世界情况的咨询项目!
  • 使用逻辑回归对客户流失进行分类
  • 使用带有随机森林的 Spark 进行分类
  • 学习如何使用 Spark 的梯度提升树
  • 使用 Spark 的 MLlib 创建强大的机器学习模型
  • 了解 DataBricks 平台!
  • 在 Amazon Web Services EC2 上进行设置以进行大数据分析
  • 了解如何使用 AWS Elastic MapReduce 服务!
  • 了解如何在 Spark 环境中利用 Linux 的强大功能!
  • 使用 Spark 和自然语言处理创建垃圾邮件过滤器!
  • 使用 Spark Streaming 实时分析推文!

本课程包括:

  • 10.5 小时点播视频
  • 4 篇文章
  • 4 可下载资源
  • 在手机和电视上访问
  • 结业证书

要求

  • 任何语言的一般编程技能(最好是 Python)
  • 本地计算机上 20 GB 的可用空间(或者 AWS 的强大互联网连接)

描述

学习最新的大数据技术——Spark!并学习将它与最流行的编程语言之一 Python 一起使用!

最有价值的技术技能之一是分析海量数据集的能力,本课程专门设计用于让您快速了解完成这项任务的最佳技术之一,Apache Spark!谷歌、Facebook、Netflix、Airbnb、亚马逊、NASA等顶级科技公司都在使用Spark来解决他们的大数据问题!

Spark 的执行速度比 Hadoop MapReduce 快 100 倍,这导致对该技能的需求激增!由于 Spark 2.0 DataFrame 框架如此新颖,您现在有能力迅速成为就业市场上知识最渊博的人之一!

本课程将通过 Python 速成课程教授基础知识,继续学习如何使用最新 Spark 2.0 语法的 Spark DataFrames!完成后,我们将介绍如何将 MLlib 机器库与 DataFrame 语法和 Spark 一起使用。在此过程中,您将进行练习和模拟咨询项目,让您置身于需要使用新技能解决实际问题的现实世界中!

我们还介绍了最新的 Spark 技术,例如 Spark SQL、Spark Streaming,以及诸如 Gradient Boosted Trees 等高级模型!完成本课程后,您会很自在地将 Spark 和 PySpark 放在简历上!本课程还提供完整的 30 天退款保证,并附有 LinkedIn 结业证书!

如果您准备好进入 Python、Spark 和大数据的世界,那么这门课程适合您!

本课程适用于:

  • 了解 Python 并想学习如何将其用于大数据的人
  • 非常熟悉另一种编程语言并需要学习 Spark 的人