更新時(shí)間:2023年03月14日17時(shí)11分 來源:傳智教育 瀏覽次數(shù):
Spark是大數(shù)據(jù)體系的明星產(chǎn)品,是一款高性能的分布式內(nèi)存迭代計(jì)算框架,可以處理海量規(guī)模的數(shù)據(jù)。本課程基于Python語(yǔ)言學(xué)習(xí)Spark3.2開發(fā),課程的講解注重理論聯(lián)系實(shí)際,方便快捷,深入淺出,讓初學(xué)者也能快速掌握。讓有經(jīng)驗(yàn)的工程師也能有所收獲。學(xué)習(xí)完成后可以勝任高級(jí)級(jí)別的大數(shù)據(jù)相關(guān)崗位。
1. 方便、快捷掌握Spark必備知識(shí),大大縮短Spark階段學(xué)習(xí)時(shí)間。
2. 基于Python語(yǔ)言!
課程涵蓋了Spark的主要知識(shí)體系,如環(huán)境部署SparkCoreSparkSQL等內(nèi)容
本視頻主要面向的群體是:
* 有Python基礎(chǔ)
* 有Hadoop生態(tài)體系基礎(chǔ)
* 想要更加深入學(xué)習(xí)分布式計(jì)算相關(guān)知識(shí)
大數(shù)據(jù)spark3.2從基礎(chǔ)到精通(滑動(dòng)查看)
第1節(jié) - PySpark導(dǎo)學(xué)
第2節(jié) - PySpark課程解讀
第3節(jié) - Spark基礎(chǔ)入門-第一章-1.1-Spark簡(jiǎn)單介紹
第4節(jié) - Spark基礎(chǔ)入門-第一章-1.2-Spark風(fēng)雨十年
第5節(jié) - Spark基礎(chǔ)入門-第一章-1.3-Spark和Hadoop的對(duì)比
第6節(jié) - Spark基礎(chǔ)入門-第一章-1.4-Spark四大特點(diǎn)
第7節(jié) - Spark基礎(chǔ)入門-第一章-1.5-Spark框架模塊
第8節(jié) - Spark基礎(chǔ)入門-第一章-1.6-Spark運(yùn)行模式
第9節(jié) - Spark基礎(chǔ)入門-第一章-1.7-Spark的架構(gòu)角色
第10節(jié) - Spark基礎(chǔ)入門-第一章-總結(jié)
第11節(jié) - Spark基礎(chǔ)入門-第二章-2.1-課程服務(wù)器環(huán)境
第12節(jié) - Spark基礎(chǔ)入門-第二章-2.2-Local模式基本原理
第13節(jié) - Spark基礎(chǔ)入門-第二章-2.3-在Linux上服務(wù)器上安裝Anaconda
第14節(jié) - Spark基礎(chǔ)入門-第二章-2.4-Spark Local模式部署
第15節(jié) - Spark基礎(chǔ)入門-第三章-3.1-StandAlone的運(yùn)行原理
第16節(jié) - Spark基礎(chǔ)入門-第三章-3.2-StandAlone部署
第17節(jié) - Spark基礎(chǔ)入門-第三章-3.3-StandAlone程序測(cè)試
第18節(jié) - Spark基礎(chǔ)入門-第三章-3.4-Spark程序運(yùn)行層次劃分
第19節(jié) - Spark基礎(chǔ)入門-第三章-3.5-總結(jié)
第20節(jié) - Spark基礎(chǔ)入門-第四章-4.1-StandAlone HA模式的運(yùn)行原理
第21節(jié) - Spark基礎(chǔ)入門-第四章-4.2-StandAlone 部署和測(cè)試
第22節(jié) - Spark基礎(chǔ)入門-第四章-4.3-總結(jié)
第23節(jié) - Spark基礎(chǔ)入門-第五章-5.1-Spark On YARN的運(yùn)行原理
第24節(jié) - Spark基礎(chǔ)入門-第五章-5.2-Spark On YARN 部署和測(cè)試
第25節(jié) - Spark基礎(chǔ)入門-第五章-5.3-兩種部署模式的區(qū)別
第26節(jié) - Spark基礎(chǔ)入門-第五章-5.4-兩種部署模式的演示和總結(jié)
第27節(jié) - Spark基礎(chǔ)入門-第五章-5.5-兩種模式任務(wù)提交流程
第28節(jié) - Spark基礎(chǔ)入門-第五章-5.6-總結(jié)
第29節(jié) - Spark基礎(chǔ)入門-第六章-6.1-框架和類庫(kù)
第30節(jié) - Spark基礎(chǔ)入門-第六章-6.2-PySpark類庫(kù)介紹
第31節(jié) - Spark基礎(chǔ)入門-第六章-6.3-PySpark安裝
第32節(jié) - Spark基礎(chǔ)入門-第六章-6.4-總結(jié)
第33節(jié) - Spark基礎(chǔ)入門-第七章-7.1-本機(jī)配置Python環(huán)境
第34節(jié) - Spark基礎(chǔ)入門-第七章-7.2-PyCharm本地和遠(yuǎn)程解釋器配置
第35節(jié) - Spark基礎(chǔ)入門-第七章-7.3-編程入口SparkContext對(duì)象以及WordCount演示
第36節(jié) - Spark基礎(chǔ)入門-第七章-7.4-WordCount代碼流程解析
第37節(jié) - Spark基礎(chǔ)入門-第七章-7.5-提交WordCount到Linux集群運(yùn)行
第38節(jié) - Spark基礎(chǔ)入門-第七章-7.6-總結(jié)
第39節(jié) - Spark基礎(chǔ)入門-第八章-8.1-Spark運(yùn)行角色回顧
第40節(jié) - Spark基礎(chǔ)入門-第八章-8.2-分布式代碼執(zhí)行分析
第41節(jié) - Spark基礎(chǔ)入門-第八章-8.3-Python On Spark執(zhí)行原理
第42節(jié) - Spark基礎(chǔ)入門-第八章-總結(jié)
第43節(jié) - SparkCore-第一章-1.1-什么是RDD
第44節(jié) - SparkCore-第一章-1.2-RDD五大特性-特性1
第45節(jié) - SparkCore-第一章-1.3-RDD五大特性-特性2
第46節(jié) - SparkCore-第一章-1.4-RDD的五大特性-特性3
第47節(jié) - SparkCore-第一章-1.5-RDD的五大特性-特性4
第48節(jié) - SparkCore-第一章-1.6-RDD的五大特性-特性5.mp4
第49節(jié) - SparkCore-第一章-1.7-WordCount結(jié)合RDD特性進(jìn)行執(zhí)行分析
第50節(jié) - SparkCore-第一章-1.8-總結(jié)
第51節(jié) - SparkCore-第二章-1-RDD的創(chuàng)建-1
第52節(jié) - SparkCore-第二章-10-RDD算子-filter
第53節(jié) - SparkCore-第二章-11-RDD算子-distinct
第54節(jié) - SparkCore-第二章-12-RDD算子-union
第55節(jié) - SparkCore-第二章-13-RDD算子-join
第56節(jié) - SparkCore-第二章-14-RDD算子-intersection
第57節(jié) - SparkCore-第二章-15-RDD算子-glom
第58節(jié) - SparkCore-第二章-16-RDD算子-groupByKey
第59節(jié) - SparkCore-第二章-17-RDD算子-sortBy
第60節(jié) - SparkCore-第二章-18-RDD算子-sortByKey
第61節(jié) - SparkCore-第二章-19-RDD算子-案例
第62節(jié) - SparkCore-第二章-2-RDD的創(chuàng)建-2
第63節(jié) - SparkCore-第二章-20-RDD算子-案例-提交到Y(jié)ARN執(zhí)行
第64節(jié) - SparkCore-第二章-21-RDD算子-countByKey
第65節(jié) - SparkCore-第二章-22-RDD算子-reduce
第66節(jié) - SparkCore-第二章-23-RDD算子-fold
第67節(jié) - SparkCore-第二章-24-RDD算子-take-first-count-top
第68節(jié) - SparkCore-第二章-25-RDD算子-takeSample
第69節(jié) - SparkCore-第二章-26-RDD算子-takeOrdered
第70節(jié) - SparkCore-第二章-27-RDD算子-foreach
第71節(jié) - SparkCore-第二章-28-RDD算子-saveAsTextFile
第72節(jié) - SparkCore-第二章-29-RDD算子-mapPartitions
第73節(jié) - SparkCore-第二章-3-RDD算子概念和分類
第74節(jié) - SparkCore-第二章-30-RDD算子-foreachPartition
第75節(jié) - SparkCore-第二章-31-RDD算子-partitionBy
第76節(jié) - SparkCore-第二章-32-RDD算子-repartition-coalesce
第77節(jié) - SparkCore-第二章-33-RDD算子-面試題-groupByKey和reduceByKey的區(qū)別
第78節(jié) - SparkCore-第二章-34-總結(jié)
第79節(jié) - SparkCore-第二章-4-轉(zhuǎn)換算子-map
第80節(jié) - SparkCore-第二章-5-轉(zhuǎn)換算子-flatMap
第81節(jié) - SparkCore-第二章-6-轉(zhuǎn)換算子-reduceByKey
第82節(jié) - SparkCore-第二章-7-RDD算子-mapValues
第83節(jié) - SparkCore-第二章-8-WordCount案例回顧
第84節(jié) - SparkCore-第二章-9-RDD算子-groupBy
第85節(jié) - SparkCore-第三章-1-RDD的數(shù)據(jù)是過程數(shù)據(jù)概念
第86節(jié) - SparkCore-第三章-2-RDD的緩存
第87節(jié) - SparkCore-第三章-3-RDD的CheckPoint
第88節(jié) - SparkCore-第三章-4-總結(jié)
第89節(jié) - SparkCore-第四章-1-jieba庫(kù)入門使用
第90節(jié) - SparkCore-第四章-2-案例需求1開發(fā)
第91節(jié) - SparkCore-第四章-3-案例需求2開發(fā)
第92節(jié) - SparkCore-第四章-4-案例需求3開發(fā)
第93節(jié) - SparkCore-第四章-5-提交代碼到Y(jié)ARN集群運(yùn)行
第94節(jié) - SparkCore-第四章-6-作業(yè)和總結(jié)
第95節(jié) - SparkCore-第五章-1-廣播變量
第96節(jié) - SparkCore-第五章-2-累加器
第97節(jié) - SparkCore-第五章-3-廣播變量累加器綜合案例
第98節(jié) - SparkCore-第五章-4-總結(jié)
第99節(jié) - SparkCore-第六章-1-DAG
第100節(jié) - SparkCore-第六章-2-寬窄依賴和階段劃分
第101節(jié) - SparkCore-第六章-3-內(nèi)存迭代計(jì)算
第102節(jié) - SparkCore-第六章-4-Spark并行度
第103節(jié) - SparkCore-第六章-5-Spark任務(wù)調(diào)度
第104節(jié) - SparkCore-第六章-6-Spark運(yùn)行概念名詞解釋和層級(jí)梳理
第105節(jié) - SparkCore-第六章-7-總結(jié)
第106節(jié) - SparkSQL-第一章-SparkSQL基礎(chǔ)入門
第107節(jié) - SparkSQL-第二章-1-SparkSQL和Hive的異同以及SparkSQL的數(shù)據(jù)抽象
第108節(jié) - SparkSQL-第二章-2-SparkSession執(zhí)行環(huán)境入口構(gòu)建和SparkSQL HelloWorld
第109節(jié) - SparkSQL-第二章-3-總結(jié)
第110節(jié) - SparkSQL-第三章-1-DataFrame對(duì)象的構(gòu)成
第111節(jié) - SparkSQL-第三章-10-DSL風(fēng)格入門API
第112節(jié) - SparkSQL-第三章-11-SQL風(fēng)格入門API
第113節(jié) - SparkSQL-第三章-12-WordCount案例
第114節(jié) - SparkSQL-第三章-13-電影評(píng)分案例編程
第115節(jié) - SparkSQL-第三章-14-SparkSQL Shuffle階段分區(qū)數(shù)參數(shù)設(shè)定
第116節(jié) - SparkSQL-第三章-15-異常數(shù)據(jù)處理API
第117節(jié) - SparkSQL-第三章-16-DataFrame數(shù)據(jù)寫出
第118節(jié) - SparkSQL-第三章-17-DataFrame使用JDBC協(xié)議讀寫數(shù)據(jù)庫(kù)(MySQL)
第119節(jié) - SparkSQL-第三章-18-總結(jié)
第120節(jié) - SparkSQL-第三章-2-DataFrame創(chuàng)建-1
第121節(jié) - SparkSQL-第三章-3-DataFrame創(chuàng)建-2
第122節(jié) - SparkSQL-第三章-4-DataFrame創(chuàng)建-3
第123節(jié) - SparkSQL-第三章-5-DataFrame創(chuàng)建-4-基于Pandas的DF轉(zhuǎn)換為SparkSQL的DF對(duì)象
第124節(jié) - SparkSQL-第三章-6-標(biāo)準(zhǔn)API讀取text數(shù)據(jù)源構(gòu)建DataFrame
第125節(jié) - SparkSQL-第三章-7-標(biāo)準(zhǔn)API讀取json構(gòu)建DataFrame
第126節(jié) - SparkSQL-第三章-8-標(biāo)準(zhǔn)API讀取jcsv構(gòu)建DataFrame
第127節(jié) - SparkSQL-第三章-9-標(biāo)準(zhǔn)API讀取jparquet構(gòu)建DataFrame
第128節(jié) - SparkSQL-第四章-1-UDF創(chuàng)建演示
第129節(jié) - SparkSQL-第四章-2-注冊(cè)返回值是數(shù)組類型的UDF
第130節(jié) - SparkSQL-第四章-3-返回字典類型的UDF定義
第131節(jié) - SparkSQL-第四章-4-拓展-通過RDD代碼模擬UDAF效果
第132節(jié) - SparkSQL-第四章-5-窗口函數(shù)的演示
第133節(jié) - SparkSQL-第四章-6-總結(jié)
第134節(jié) - SparkSQL-第五章-1-Catalyst優(yōu)化器
第135節(jié) - SparkSQL-第五章-2-SparkSQL執(zhí)行流程及本章總結(jié)
第136節(jié) - SparkSQL-第六章-SparkOnHive原理和配置及總結(jié)
第137節(jié) - SparkSQL-第七章-分布式SQL的執(zhí)行引擎原理和配置
第138節(jié) - 案例-案例背景及需求1開發(fā)
第139節(jié) - 案例-需求2開發(fā)
第140節(jié) - 案例-需求3開發(fā)
第141節(jié) - 案例-需求4開發(fā)
第142節(jié) - Spark新特性及核心回顧-1-1-HashShuffleManager
第143節(jié) - Spark新特性及核心回顧-1-2-SortShuffleManager
第144節(jié) - Spark新特性及核心回顧-1-3-總結(jié)
第145節(jié) - Spark新特性及核心回顧-2-1-3.0新特性-AQE
第146節(jié) - Spark新特性及核心回顧-2-2-新特性-動(dòng)態(tài)分區(qū)裁剪
第147節(jié) - Spark新特性及核心回顧-2-3-新特性-koalas庫(kù)
第148節(jié) - Spark新特性及核心回顧-2-4-總結(jié)
第149節(jié) - Spark新特性及核心回顧-3-Spark概念總結(jié)
未完待續(xù),黑馬老師996更新中......
掌握行業(yè)熱門技術(shù)
是每個(gè)程序員都應(yīng)該重視的事情
pyspark框架如此重要,你還沒學(xué)?
點(diǎn)擊或搜索黑馬程序員B站
觀看全集視頻
- 完整配套資料領(lǐng)取方式 -
(視頻+講義+源碼+筆記+資料)
黑馬程序員視頻庫(kù)
北京校區(qū)