本站资源全部免费,回复即可查看下载地址!
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
课程名称: 开源力量Spark开发实战 Spark架构原理集群开发视频教程
课程简介:
本课程内容主要包括Spark生态系统、Spark架构、Spark执行原理的概述,实际动手搭建Spark集群,同时学习Spark实时计算、Spark Streaming流式计算的多语言编程,最后学习Spark SQL、基于Spark的机器学习、图计算等相关内容。
课程背景
Hadoop在大数据领域应经证明了其存在的价值,在超大数据量时,Hadoop有着较高的优势。
但是在普通数据量实时计算上面还是差很多,因为Hadoop的设计导致数据计算具有较高的延迟,所以无法满足实时数据需求,而单机计算更没有办法满足,由此诞生了Spark,基于内存的分布式实时计算框架,在某些数据量情况下,Spark的计算性能超Hadoop百倍,而算法实现仅有其1/10,甚至更少,所有Spark未来会成为大数据领域一颗耀眼的明星!
课程大纲
第一周 Spark生态系统概述
1.Spark生态系统概述
2.BDAS
3.Spark运行模式
4.Spark核心内容
(1)RDD
(2)transformation
(3)action
5.lineage
6.容错处理
7.宽依赖与窄依赖
第二周 Spark运行、开发环境搭建
1.Hadoop2.x安装
2.spark源码编译
3.spark安装及测试
4.Spark on YARN
5.开发环境搭建
第三周 spark 编程
1.常用RDD
2.常用transformation
3.常用action
4.Scala、Python、JAVA多种语言编程实践
第四周 Spark Streaming概述及实践
1.DStream
2.数据源
3.transformation on DStreams
4.checkpoint
5.容错
6.编程实践
7.性能优化
----------------------课程目录----------------------
│ 课时1:spark基本介绍,RDD操作方式.rar
│ 课时2:付费学员服务指引.rar
│ 课时3:学习资料.rar
│ 课时4:1.Spark基本介绍.rar
│ 课时5:2.Spark-RDD操作方式.rar
│ 课时6:3.spark容错、调度.rar
│ 课时7:1.spark安装基础,JDK、hadoop.rar
│ 课时8:2.scala、spark安装及测试.rar
│ 课时9:3.开发环境搭建.rar
│ 课时10:PPT课件
│ 课时11:学习资料课件
│ 课时12:1.RDD知识回顾.rar
│ 课时13:2.transformation实践操作.rar
│ 课时14:3.RDD之Transformation.rar
│ 课时15:4.RDD之action学习.rar
│ 课时16:PPT课件
│ 课时17:1.SparkStreaming.rar
│ 课时18:2.spark之transformation.rar
│ 课时19:3.sparkstreaming之Windowsoperations.rar
│ 课时20:4.sparkstreaming之transformoperations.rar
│ 课时21:5.sparkstreaming之outputoperation及代码优化点.rar
下载地址:
|
温馨提示:
1、本站所有内容均为互联网收集或网友分享或网络购买,本站不破解、不翻录任何视频!
2、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意!
3、本站资源仅供本站会员学习参考,不得传播及用于其他用途,学习完后请在24小时内自行删除.
4、本站资源质量虽均经精心审查,但也难保万无一失,若发现资源有问题影响学习请一定及时点此进行问题反馈,我们会第一时间改正!
5、若发现链接失效了请联系管理员,管理员会在2小时内修复
6、如果有任何疑问,请加客服QQ:1300822626 2小时内回复你!