Python与Spark大数据(PySpark)
Spark and Python for Big Data with PySpark
📈🐍🔥学习大数据处理?试试 PySpark!本教程将带你使用 Python 和 Spark 处理海量数据。#数据科学 #编程 #大数据
课程内容
ython 编程语言介绍 Spark,训练您使用 Spark 解决大数据问题所需的基本技能,并学习如何使用新的 Spark 2.0 DataFrame 语法。您还将学习如何使用 Spark 的 MLlib 创建强大的机器学习模型,以及如何使用逻辑回归、随机森林和梯度提升树等算法对客户流失进行分类。此外,本课程还将介绍使用 Spark 和自然语言处理技术创建垃圾邮件过滤器的方法,并使用 Spark Streaming 实时分析推文。
除了了解 Spark 的技术,本课程还将教您如何在亚马逊 AWS 的 EC2 上设置环境进行大数据分析,以及如何使用 AWS Elastic MapReduce 服务。您还将学习如何在 Spark 环境中利用 Linux 强大的功能。
绝不浪费您的时间,本课程使用的案例涉及模拟现实世界情况的咨询项目,为您提供实战经验。无论您是想学习新技能还是提高自己的技能,这门课程都将满足您的需求。
本课程紧跟行业动态,着重介绍最新的大数据技术,适合所有人士,而且您只需要基本的编程知识即可。最重要的是,您将获得结业证书,成为 Spark 大数据分析方面的专家!
【包含】
🎬 10.5 小时点播视频
📰 4 篇文章
💾 4 可下载资源
📱📺 在手机和电视上访问
🎓 结业证书
【要求】
👨💻 任何语言的一般编程技能,Python最佳
💻 本地计算机上 20 GB 的可用空间(或者 AWS 的强大互联网连接)
【标签】
#Spark #大数据 #Python #机器学习 #AWS #数据分析