2021 Spark核心原理与实战
01-课程介绍.mp402-内容综述.mp4
03-Spark简介及生态介绍.mp4
04-Spark原理及特点:模块概述+特点.mp4
05-Spark原理及特点:运行模式+集群组角色.mp4
06-Spark原理及特点:Spark作业运行流程.mp4
07-Spark的运行环境安装:Standalone入门实战.mp4
08-Spark的运行环境安装:YARN入门实战.mp4
09-Spark批处理做作业入门Demo.mp4
10-Spark流处理做作业入门Demo.mp4
11-SparkRDD原理:RDD抽象及相关概念.mp4
12-SparkRDD原理:RDD依赖关系、Stage、RDD持久化、SparkPreferredLocation及CheckPoint原理和使用.mp4
13-SparkRDD实战:如何利用外部数据集生成RDD?.mp4
14-SparkRDD实战:Transformation和Action概念、LazyLoad及SparkFunction的3种实现方式.mp4
15-SparkRDD实战:常用Transformation原理及实战.mp4
16-SparkRDD实战:Action原理和实战、Spark广播变量原理和使用.mp4
17-SparkSQL、DataFrame、DataSet原理和使用.mp4
18-SparkSQLJoin操作及SparkSQLFunction.mp4
19-SparkSQL原理和执行过程.mp4
20-常用数据格式原理和使用:TEXT、CSV、JSON、PARQUET在Spark中的使用.mp4
21-常用数据格式原理和使用:ORC、AVRO在Spark中的使用.mp4
22-SparkConnecter:HDFS及HBase.mp4
23-SparkConnecter:MongoDB.mp4
24-SparkConnecter:Cassandra.mp4
25-SparkConnecter:MySQL及Kafka.mp4
26-SparkConnecter:ElasticSearch.mp4
27-SparkStearming原理及实战:创建一个SparkStreaming应用.mp4
28-SparkStearming原理及实战:DStream操作、数据持久化及性能优化.mp4
29-SparkStructuredStearming原理及实战:StructuredStreaming概念、特点、数据模型和应用实战.mp4
30-SparkStructuredStearming原理及实战:StructuredStearming事件时间、延迟数据处理策略、容错语义和编程模型.mp4
31-SparkStructuredStearming原理及实战:StructuredStearming时间窗口操作、水位线和数据更新模式.mp4
32-SparkStructuredStearming原理及实战:StreamJoin操作、重复数据处理、多Watermark处理策略、StructuredStearming结果输出.mp4
33-Spark文件读写原理.mp4
34-内存调优:JVM内存调优、堆外内存设置及storageFraction设置.mp4
35-任务调优:Executor数量内存及CPU配置、设置合理的并行度、Task等待时长调优、Blacklisting调优.mp4
36-失败重试与黑名单机制、推测式执行、资源申请机制.mp4
37-SparkOnYARN:Client模式与Cluster模式.mp4
38-SparkOnYARN:FIFOScheduler、CapacityScheduler原理和使用.mp4
39-SparkOnYARN:YARNFairScheduler原理、使用及特点.mp4
40-Spark文件读写原理.mp4
41-内存调优:JVM内存调优、堆外内存设置及storageFraction设置.mp4
42-任务调优:Executor数量内存及CPU配置、设置合理的并行度、Task等待时长调优、Blacklisting调优.mp4
43-数据调优:数据本地性、复用RDD、BroadCast、Kryo序列化和CheckPoint.mp4
44-算子调优.mp4
45-SparkSQL调优和SparkStreaming调优.mp4
46-Spark数据倾斜问题处理.mp4
47-Spark机器学习概述:机器学习应用场景、分类和常用算法.mp4
48-机器学习流程:数据收集与存储、数据清理与转换.mp4
49-机器学习流程:模型训练、模型测试、模型部署与整合、模型监控与反馈及数据探索和可视化.mp4
50-Spark常用统计方法:基础统计、相关性分析、数据抽样.mp4
51-分类模型:概念与种类、线性回归及逻辑回归原理实现.mp4
52-分类模型:朴素贝叶斯原理实现、决策树原理实现及协同过滤原理.mp4
53-聚类模型:基于K-Means的聚类算法原理实现.mp4
54-MLPipLine:如何通过SparkMLPipLine模式实现模型训练?.mp4
55-Spark3.0新特性概述.mp4
56-Spark未来趋势:为什么需要数据湖?.mp4
57-Spark未来趋势:DeltaLake原理.mp4
58-Spark未来趋势:DeltaLake实战.mp4
59-Spark应用番外篇:大数据任务调度.mp4
60-结束语.mp4
geektime-Spark-master.rar
下载地址:
**** Hidden Message ***** 确实是难得好帖啊,顶先 啥也不说了,感谢楼主分享哇! 正需要,支持楼主大人了! 啥也不说了,感谢楼主分享哇! 啥也不说了,感谢楼主分享哇! 正需要,支持楼主大人了! 啥也不说了,感谢楼主分享哇! 啥也不说了,感谢楼主分享哇!