课程介绍

课程来自极客时间吴磊《Spark性能调优实战》

目前,Spark已经成为分布式数据处理技术的事实标准,并逐渐成为各大互联网公司的标准。火花开发是数据领域任何工程师的必备技能。想要进入大厂,就得有丰富的Spark性能调优经验。

但现实是,我们很容易快速开始开发应用程序,却找不到关于应用程序执行性能的线索,比如:

显然,这都是内存计算。为什么我使用了RDD/数据帧缓存,但性能变得更差了?

为什么我在网上使用美妙的调音方法不容易?

并行性也不低。为什么我的CPU利用率上不去?

几乎所有的节点内存都分配给了Spark。为什么我的应用程序是OOM?

为此,我们特别邀请了Leo先生,他根据自己多年的数据处理经验,梳理出了一套关于性能调优的方法论,可以帮助你有效地加速Spark工作的性能,建立以性能为导向的开发习惯。

此外,他还会手把手教你搭建分布式应用,让你从不同角度洞察汽油车抖号的趋势和走向,让你在操控性能调优的技巧和思路上有“质的飞跃”。

极客时间吴磊《Spark性能调优实战》插图

课程大纲

| ├──01 性能调优的必要性:Spark本身就很快,为啥还需要我调优?.pdf 2.98M
| ├──01 性能调优的必要性:Spark本身就很快,为啥还需要我调优?mp3 11.85M
| ├──02 性能调优的本质:调优的手段五花八门,该从哪里入手?.pdf 3.16M
| ├──02 性能调优的本质:调优的手段五花八门,该从哪里入手?mp3 12.90M
| ├──03 RDD:为什么你必须要理解弹性分布式数据集?.pdf 3.52M
| ├──03 RDD:为什么你必须要理解弹性分布式数据集?mp3 14.25M
| ├──04 DAG与流水线:到底啥叫“内存计算”?.pdf 3.54M
| ├──04 DAG与流水线:到底啥叫“内存计算”?mp3 14.93M
| ├──05 调度系统:“数据不动代码动”到底是什么意思?.pdf 5.24M
| ├──05 调度系统:“数据不动代码动”到底是什么意思?mp3 23.18M
| ├──06 存储系统:空间换时间,还是时间换空间?.pdf 3.79M
| ├──06 存储系统:空间换时间,还是时间换空间?mp3 17.67M
| ├──07 内存管理基础:Spark如何高效利用有限的内存空间?.pdf 4.43M
| ├──07 内存管理基础:Spark如何高效利用有限的内存空间?mp3 18.61M
| ├──08 应用开发三原则:如何拓展自己的开发边界?mp3 21.80M
| ├──08 应用开发三原则:如何拓展自己的开发边界?.pdf 4.98M
| ├──开篇词 Spark性能调优,你该掌握这些“套路”.pdf 3.53M
| └──开篇词 Spark性能调优,你该掌握这些“套路”mp3 10.15M

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用,未经站长允许禁止转载、转售本站资源。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络站长QQ:502212423。

如果您已经成功付款但是无法显示下载地址,下载地址失效,请联系站长提供付款信息为您处理

教程资源、源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好是您所需要的资源