课程介绍
课程来自极客时间吴磊《Spark性能调优实战》
目前,Spark已经成为分布式数据处理技术的事实标准,并逐渐成为各大互联网公司的标准。火花开发是数据领域任何工程师的必备技能。想要进入大厂,就得有丰富的Spark性能调优经验。
但现实是,我们很容易快速开始开发应用程序,却找不到关于应用程序执行性能的线索,比如:
显然,这都是内存计算。为什么我使用了RDD/数据帧缓存,但性能变得更差了?
为什么我在网上使用美妙的调音方法不容易?
并行性也不低。为什么我的CPU利用率上不去?
几乎所有的节点内存都分配给了Spark。为什么我的应用程序是OOM?
为此,我们特别邀请了Leo先生,他根据自己多年的数据处理经验,梳理出了一套关于性能调优的方法论,可以帮助你有效地加速Spark工作的性能,建立以性能为导向的开发习惯。
此外,他还会手把手教你搭建分布式应用,让你从不同角度洞察汽油车抖号的趋势和走向,让你在操控性能调优的技巧和思路上有“质的飞跃”。
课程大纲
| ├──01 性能调优的必要性:Spark本身就很快,为啥还需要我调优?.pdf 2.98M
| ├──01 性能调优的必要性:Spark本身就很快,为啥还需要我调优?mp3 11.85M
| ├──02 性能调优的本质:调优的手段五花八门,该从哪里入手?.pdf 3.16M
| ├──02 性能调优的本质:调优的手段五花八门,该从哪里入手?mp3 12.90M
| ├──03 RDD:为什么你必须要理解弹性分布式数据集?.pdf 3.52M
| ├──03 RDD:为什么你必须要理解弹性分布式数据集?mp3 14.25M
| ├──04 DAG与流水线:到底啥叫“内存计算”?.pdf 3.54M
| ├──04 DAG与流水线:到底啥叫“内存计算”?mp3 14.93M
| ├──05 调度系统:“数据不动代码动”到底是什么意思?.pdf 5.24M
| ├──05 调度系统:“数据不动代码动”到底是什么意思?mp3 23.18M
| ├──06 存储系统:空间换时间,还是时间换空间?.pdf 3.79M
| ├──06 存储系统:空间换时间,还是时间换空间?mp3 17.67M
| ├──07 内存管理基础:Spark如何高效利用有限的内存空间?.pdf 4.43M
| ├──07 内存管理基础:Spark如何高效利用有限的内存空间?mp3 18.61M
| ├──08 应用开发三原则:如何拓展自己的开发边界?mp3 21.80M
| ├──08 应用开发三原则:如何拓展自己的开发边界?.pdf 4.98M
| ├──开篇词 Spark性能调优,你该掌握这些“套路”.pdf 3.53M
| └──开篇词 Spark性能调优,你该掌握这些“套路”mp3 10.15M
声明:本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理,邮箱:502212423@qq.com。