目前課程版本:8.1 升級(jí)時(shí)間:2020.07.11 查看詳細(xì)
我們的課程幫助了近500名零基礎(chǔ)的學(xué)員高薪就業(yè),近2000名學(xué)生正在努力蛻變中。0基礎(chǔ)也能高薪就業(yè)的大數(shù)據(jù)課程。
全面升級(jí)Spark核心就業(yè)項(xiàng)目,新增第四代大數(shù)據(jù)處理框架Flink,強(qiáng)化推薦系統(tǒng)實(shí)戰(zhàn)并擴(kuò)充至7天。
所有項(xiàng)目均是來(lái)自企業(yè)實(shí)戰(zhàn)項(xiàng)目,報(bào)表分析、日志分析、推薦系統(tǒng)/廣告系統(tǒng)、反欺詐系統(tǒng)、為就業(yè)提供強(qiáng)力保障。
課程全面覆蓋大數(shù)據(jù)技術(shù),數(shù)據(jù)收集、存儲(chǔ)、計(jì)算、挖掘、展現(xiàn),離線分析/實(shí)時(shí)分析/內(nèi)存計(jì)算一網(wǎng)打盡。
大數(shù)據(jù)時(shí)代已然到來(lái),在數(shù)據(jù)已經(jīng)在一線企業(yè)、中小型企業(yè)、傳統(tǒng)企業(yè)、互聯(lián)網(wǎng)企業(yè)全面落地。就業(yè)不再局限于互聯(lián)網(wǎng)行業(yè)。
職位技能要求 | V7.0 | V8.1 | 說(shuō)明 |
了解HDFS, Hbase, Kafka、Flink等原理 | 有 | 更強(qiáng)化 | V8.1對(duì)HDFS、HBase、Kafka、Flink原理進(jìn)一步強(qiáng)化,例如:HBase布隆過(guò)濾器、預(yù)分區(qū)、Kafka再均衡、Flink狀態(tài)管理、一致性深度剖析 |
熟悉Linux系統(tǒng),熟練掌握J(rèn)AVA或Scala語(yǔ)至少一種 | 有 | 更強(qiáng)化 | V8.1對(duì)Java課程、Scala課程進(jìn)一步升級(jí),在Java多線程、爬蟲(chóng)、網(wǎng)絡(luò)編程、JVM都進(jìn)行強(qiáng)化,這樣對(duì)后續(xù)的分布式框架學(xué)習(xí)會(huì)有更有力的支撐。 |
熟悉一種關(guān)系型數(shù)據(jù)庫(kù),具備一定的SQL功底 | 有 | 更強(qiáng)化 | V8.1通過(guò)更多的項(xiàng)目來(lái)保障學(xué)生的SQL編程能力,更多的指標(biāo)保證學(xué)生有足夠多的練習(xí) |
精通多維數(shù)據(jù)建模和ETL開(kāi)發(fā) | 有 | 更強(qiáng)化 | V8.1從項(xiàng)目一開(kāi)始就能夠教會(huì)學(xué)生如何基于業(yè)務(wù)進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)建模、維度建模、分層。并在課堂上手把手帶學(xué)生編寫(xiě)ETL代碼, |
了解Hadoop相關(guān)組件Hive/hbase/sqoop等,具備整體ETL/DW/BI的思想 | 有 | 更強(qiáng)化 | 在V8.1技術(shù)課程中,清晰的分析Hive、Hbase、sqoop的操作、運(yùn)行流程、底層原理,并且結(jié)合項(xiàng)目中具體的業(yè)務(wù)場(chǎng)景,將這些技術(shù)真正用起來(lái),學(xué)生在項(xiàng)目中學(xué)會(huì)有深度業(yè)務(wù)的ETL、DW、BI開(kāi)發(fā) |
熟練使用 MR/Spark Streaming/hive/spark 解決業(yè)務(wù)問(wèn)題 | 有 | 更強(qiáng)化 | V8.1課程中清晰介紹批處理框架以及流處理框架的運(yùn)行特點(diǎn),并深度解析如何針對(duì)不同的計(jì)算引擎進(jìn)行調(diào)優(yōu)。更涵蓋了Structured Streaming、以及Flink的優(yōu)秀流式框架應(yīng)用以及原理。并在物流項(xiàng)目、車(chē)聯(lián)網(wǎng)項(xiàng)目、知行在線教育等項(xiàng)目中都有具體的業(yè)務(wù)應(yīng)用 |
熟悉Linux下開(kāi)發(fā), 熟練使用shell/python等腳本語(yǔ)言; | 有 | 更強(qiáng)化 | V8.1課程強(qiáng)化SHELL腳本編程,并手把手帶學(xué)生學(xué)會(huì)編寫(xiě)在大數(shù)據(jù)項(xiàng)目中如何使用SHELL進(jìn)行調(diào)度程序開(kāi)發(fā),在高級(jí)課程中學(xué)習(xí)Python大數(shù)據(jù)技術(shù)生態(tài)圈,涵蓋Python數(shù)據(jù)分析、PySpark、數(shù)據(jù)挖掘等內(nèi)容 |
負(fù)責(zé)大數(shù)據(jù)實(shí)時(shí)、離線處理程序開(kāi)發(fā),根據(jù)產(chǎn)品需求,設(shè)計(jì)開(kāi)發(fā)數(shù)據(jù)處理程序 | 有 | 更強(qiáng)化 | V8.1課程中有大量的實(shí)時(shí)、離線項(xiàng)目,學(xué)生只有通過(guò)大量練習(xí),才能更好地掌握分布式程序的編寫(xiě)技巧,更能具備多個(gè)行業(yè)的數(shù)據(jù)處理特點(diǎn) |
面向業(yè)務(wù)目標(biāo),對(duì)數(shù)據(jù)模型、數(shù)據(jù)分布、數(shù)據(jù)傳輸、數(shù)據(jù)存儲(chǔ)等方面進(jìn)行大數(shù)據(jù)場(chǎng)景的功能開(kāi)發(fā) | 部分 | 更完整 | V8.1課程更注重培養(yǎng)學(xué)生的業(yè)務(wù)分析、建模、代碼轉(zhuǎn)換實(shí)現(xiàn)能力,每一個(gè)行業(yè)、每一個(gè)項(xiàng)目都會(huì)進(jìn)行業(yè)務(wù)場(chǎng)景的深度解析,并且每個(gè)項(xiàng)目都是從采集、預(yù)處理、分析到最終應(yīng)用完整流程,學(xué)生通過(guò)項(xiàng)目能夠?qū)W習(xí)真正企業(yè)級(jí)的項(xiàng)目 |
有數(shù)據(jù)分析相關(guān)經(jīng)驗(yàn), 了解基本數(shù)據(jù)分析工具; | 部分 | 有 | 課程中包含了常用的一些數(shù)據(jù)分析方法,包括分類(lèi)、對(duì)比、趨勢(shì)等分析,并通過(guò)使用ETL、BI工具來(lái)進(jìn)行快速處理、展示 |
有大規(guī)模數(shù)據(jù)收集,日志處理經(jīng)驗(yàn); | 部分 | 更完整 | V8.1課程中涵蓋了多行的多種數(shù)據(jù)采集方式,因?yàn)椴煌袠I(yè)數(shù)據(jù)接口不一樣,要通過(guò)不同方式采集數(shù)據(jù),例如:證券數(shù)據(jù)通過(guò)socket+Flume自定義source采集、物流數(shù)據(jù)采用Oracle Golden Gate、Canal進(jìn)行實(shí)時(shí)采集、車(chē)聯(lián)網(wǎng)通過(guò)云服務(wù)器+Kafka采集等,這樣學(xué)生才能具備豐富的收集處理經(jīng)驗(yàn) |
了解機(jī)器學(xué)習(xí)算法; | 有 | 有 | V8.1課程涵蓋機(jī)器學(xué)習(xí)算法,并將這些算法與數(shù)據(jù)挖掘結(jié)合應(yīng)用,基于這些算法進(jìn)行數(shù)據(jù)挖掘建模,并進(jìn)行參數(shù)調(diào)優(yōu),減少模型的誤差率 |
深入研究過(guò)大數(shù)據(jù)框架的運(yùn)行機(jī)制、實(shí)現(xiàn)原理、源碼者。 | 部分 | 更強(qiáng)化 | V8.1講解框架都會(huì)深度剖析框架的底層原理,結(jié)合代碼和配圖給學(xué)生講解設(shè)計(jì)原因,不僅要保證內(nèi)容深度,還有兼顧學(xué)生能夠?qū)W會(huì) |
0基礎(chǔ)0經(jīng)驗(yàn)的小白人員;想通過(guò)更低的成本來(lái)試一下自己是否適合做大數(shù)據(jù)相關(guān)工作的轉(zhuǎn)型人員。
注:獲取更多免費(fèi)學(xué)習(xí)視頻+資料+筆記,請(qǐng)加QQ:2632311208。
全日制脫產(chǎn),每周5天上課, 上兩天課休息一天的上課方式(實(shí)際培訓(xùn)時(shí)間可能因法定節(jié)假日等因素發(fā)生變化)
部分校區(qū)可能會(huì)根據(jù)實(shí)際情況有所調(diào)整,詳情可詢咨詢老師 點(diǎn)擊咨詢
大數(shù)據(jù)基礎(chǔ)班課程大綱 | |||
階段名稱(chēng) | 主講內(nèi)容 | 技術(shù)要點(diǎn) | 學(xué)習(xí)目標(biāo) |
零基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)課程 | 操作系統(tǒng)基礎(chǔ) | 計(jì)算機(jī)基礎(chǔ)知識(shí)、Linux環(huán)境搭建、遠(yuǎn)程連接工具、文件操作命令、壓縮解壓縮命令、文件查找命令、系統(tǒng)管理命令、權(quán)限管理、網(wǎng)絡(luò)服務(wù)管理命令、VI等。 | 掌握企業(yè)級(jí)ETL平臺(tái)的kettle; 掌握BI的可視化平臺(tái)Superset; 掌握Kettle ETL處理設(shè)計(jì)思想; 掌握大數(shù)據(jù)企業(yè)開(kāi)發(fā)中最常見(jiàn)的的linux的操作; 掌握一款主流數(shù)據(jù)庫(kù)客戶端工具DataGrip; 掌握企業(yè)MySQL的調(diào)優(yōu)方案; 掌握大數(shù)據(jù)分析中數(shù)據(jù)全量及增量同步解決方案; 掌握生產(chǎn)環(huán)境中數(shù)據(jù)分析程序的部署解決方案。 |
關(guān)系型數(shù)據(jù)庫(kù) | 數(shù)據(jù)庫(kù)環(huán)境搭建、SQL語(yǔ)言(DDL、DML、DQL)、多表查詢、索引等。 | ||
可視化ETL平臺(tái) | 數(shù)據(jù)倉(cāng)庫(kù)與ETL、Kettle安裝部署、數(shù)據(jù)抽取與裝載、表輸入、表輸出、插入/更新、switch/case等組件使用、Kettle作業(yè)等。 | ||
BI可視化開(kāi)發(fā) | Superset部署、開(kāi)發(fā),涵蓋Charts開(kāi)發(fā)、Dashboard開(kāi)發(fā)。 | ||
電商數(shù)據(jù)倉(cāng)庫(kù)實(shí)戰(zhàn) | 電商業(yè)務(wù)背景、案例架構(gòu)、數(shù)據(jù)倉(cāng)庫(kù)增量同步、ETL開(kāi)發(fā)、指標(biāo)SQL開(kāi)發(fā)、Kettle作業(yè)調(diào)度、Superset可視化展示等。 |
本課程適合于計(jì)算機(jī)專(zhuān)業(yè),有一定Java基礎(chǔ)、通過(guò)入學(xué)考核的未工作人士。
提示:測(cè)試題主要考察您是否具備Java基礎(chǔ),以便我們統(tǒng)一入學(xué)基礎(chǔ),更好地開(kāi)展教學(xué)工作。如果您感覺(jué)測(cè)試題很難,我們建議您參加我們的Java基礎(chǔ)班學(xué)習(xí)。
全日制脫產(chǎn),每周5天上課, 上兩天課休息一天的上課方式(實(shí)際培訓(xùn)時(shí)間可能因法定節(jié)假日等因素發(fā)生變化)
部分校區(qū)可能會(huì)根據(jù)實(shí)際情況有所調(diào)整,詳情可詢咨詢老師 點(diǎn)擊咨詢
大數(shù)據(jù)就業(yè)班課程大綱 | |||
階段名稱(chēng) | 主講內(nèi)容 | 技術(shù)要點(diǎn) | 學(xué)習(xí)目標(biāo) |
Java語(yǔ)言編程 | 編程基礎(chǔ) | Java概述、Java程序入門(mén)、常量與變量、數(shù)據(jù)類(lèi)型、運(yùn)算符、流程控制語(yǔ)句、方法、數(shù)組。 | 可掌握的核心: 掌握J(rèn)ava程序基礎(chǔ)數(shù)據(jù)類(lèi)型; 掌握開(kāi)發(fā)中常用類(lèi)如集合、IO流、常用類(lèi)等操作; 掌握J(rèn)ava異常處理機(jī)制; 掌握反射、網(wǎng)絡(luò)編程、多線程開(kāi)發(fā); 掌握J(rèn)soup的網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā); 掌握J(rèn)DBC操作; 掌握ETL數(shù)據(jù)處理和BI報(bào)表開(kāi)發(fā) 。 可以解決的問(wèn)題: 具備JavaSE開(kāi)發(fā)能力。 市場(chǎng)價(jià)值: 可勝任初級(jí)爬蟲(chóng)工程師崗位。 |
面向?qū)ο?/td> | 面向?qū)ο笏枷搿㈩?lèi)與對(duì)象、成員變量和局部變量、封裝、 this關(guān)鍵字、構(gòu)造方法。 | ||
常用類(lèi) | Object類(lèi)、String、StringBuilder等。 | ||
集合操作 | 數(shù)據(jù)結(jié)構(gòu)、List、Set、Map等。 | ||
IO操作 | 字節(jié)輸入流、序列化、字節(jié)輸出流、Apache Commons IO等。 | ||
Java基礎(chǔ)增強(qiáng) | 反射、網(wǎng)絡(luò)編程、多線程、注解等。 | ||
JDBC | JDBC基本概述、JDBC入門(mén)和步驟分析、DriverManager詳解、Connection詳解、Statement詳解、ResultSet詳解、Driver接口介紹、JDBC的CRUD操作、SQL注入分析、PreparedStatement詳解、JDBC的使用案例、連接池基礎(chǔ)、C3P0連接池的使用。 | ||
Maven | Maven環(huán)境搭建、Maven構(gòu)建、自動(dòng)化構(gòu)建、本地倉(cāng)庫(kù)&中央倉(cāng)庫(kù)、pom.xml、依賴(lài)管理、坐標(biāo)、依賴(lài)、生命周期等、IDEA下的Maven使用。 | ||
爬蟲(chóng)案例 | Jsoup、MySQL高級(jí)、JDBC、ETL、BI | ||
Hadoop技術(shù)棧 | Linux操作系統(tǒng)高級(jí) | Linux shell編程、awk、sed、cut、ssh、scp、expect、yum、nestat、top 、iostat等高級(jí)命令使用。 | 可掌握的核心: 掌握shell編程; 掌握Z(yǔ)ooKeeper原理并應(yīng)用; 掌握HDFS的使用和MapReduce編程; 理解MapReduce原理和調(diào)優(yōu); 掌握Yarn的原理和調(diào)優(yōu); 掌握Hive的使用和調(diào)優(yōu)。 可以解決的問(wèn)題: 具備Hadoop開(kāi)發(fā)能力、離線數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)能力。 市場(chǎng)價(jià)值: 可勝任初級(jí)Hadoop工程師崗位。 |
大數(shù)據(jù)基礎(chǔ)和硬件介紹 | 大數(shù)據(jù)的特點(diǎn)、分布式存儲(chǔ)概念、分布式計(jì)算的概念、服務(wù)器種類(lèi)介紹、機(jī)架、交換機(jī)、網(wǎng)絡(luò)拓?fù)?、Raid、IDC數(shù)據(jù)中心。 | ||
Zookeeper | Zookeeper的應(yīng)用場(chǎng)景、架構(gòu)和原理、存儲(chǔ)模型、選舉機(jī)制、客戶端操作。 | ||
HDFS | HDFS設(shè)計(jì)的特點(diǎn)、Master-Slave架構(gòu)、Block塊存儲(chǔ)、RF拷貝因子、機(jī)架感知、Block拷貝策略、讀寫(xiě)流程、HDFS Federation、HDFS Snapshots、NameNode HA架構(gòu)和原理、HDFS管理員常用操作、HDFS權(quán)限控制。 | ||
MapReduce | MapReduce架構(gòu)和原理、Split機(jī)制、MapReduce并行度、Combiner機(jī)制、Partition機(jī)制、自定義Partition、MapReduce序列化、自定義排序、數(shù)據(jù)壓縮。 | ||
YARN | Yarn原理和架構(gòu)、Yarn高可用、Container資源的封裝(CPU、內(nèi)存和IO)、資源調(diào)度策略(FIFO、Fair和Capacity)。 | ||
Hive | Hive原理和架構(gòu)、HQL操作、數(shù)據(jù)類(lèi)型、分區(qū)、分桶、臨時(shí)表、Meta Store服務(wù)、HiveServer內(nèi)置函數(shù)、自定義UDF和UDAF、數(shù)據(jù)壓縮、存儲(chǔ)格式、自動(dòng)化腳本、常見(jiàn)性能優(yōu)化、explain執(zhí)行計(jì)劃詳解。 | ||
項(xiàng)目一(在線教育) | 1、還原大型在線教育的大數(shù)據(jù)平臺(tái)。 2、建立企業(yè)數(shù)據(jù)倉(cāng)庫(kù),統(tǒng)一企業(yè)數(shù)據(jù)中心,把分散的業(yè)務(wù)數(shù)據(jù)集中存儲(chǔ)和處理。 3、項(xiàng)目從需求調(diào)研、設(shè)計(jì)、版本控制、研發(fā)、測(cè)試到落地上線,涵蓋了項(xiàng)目的完整工序。 4、挖掘分析海量用戶行為數(shù)據(jù),定制多維數(shù)據(jù)集合,形成數(shù)據(jù)集市,供各個(gè)場(chǎng)景主題使用。 |
基于CM自動(dòng)部署和配置、 數(shù)據(jù)倉(cāng)庫(kù)建模、離線數(shù)倉(cāng)架構(gòu)分層、 使用Git版本控制和CodeReview、使用Oozie進(jìn)行作業(yè)調(diào)度、Hive2的使用和調(diào)優(yōu)、 Sqoop進(jìn)行Mysql和Hive的雙向海量數(shù)據(jù)同步、使用拉鏈表完成增量數(shù)據(jù)的統(tǒng)計(jì)分析、使用FineReport完成數(shù)據(jù)可視化。 |
可掌握的核心: 掌握從需求、設(shè)計(jì)、研發(fā)、測(cè)試到落地上線的完整項(xiàng)目流程; 掌握大量教育行業(yè)的真實(shí)業(yè)務(wù)邏輯,涉及20多個(gè)主題,100多個(gè)指標(biāo); 掌握海量數(shù)據(jù)如何調(diào)優(yōu)、使用拉鏈表、增量數(shù)據(jù)處理,以及Hive函數(shù)的具體應(yīng)用等; 掌握基于CM的大數(shù)據(jù)環(huán)境部署和管理; 掌握數(shù)據(jù)倉(cāng)庫(kù)的核心概念和應(yīng)用; 掌握常用離線大數(shù)據(jù)技術(shù):Oozie、Sqoop、Hive等; 掌握FineReport可視化。 可以解決的問(wèn)題: 具備企業(yè)級(jí)離線數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)能力,深入教育行業(yè)需求,提升學(xué)員在行業(yè)的核心競(jìng)爭(zhēng)力。 市場(chǎng)價(jià)值: 可勝任Hadoop工程師、離線數(shù)據(jù)倉(cāng)庫(kù)工程師、ETL開(kāi)發(fā)工程師、FineReport BI開(kāi)發(fā)工程師等崗位。 |
數(shù)據(jù)微服務(wù)接口開(kāi)發(fā) | Spring | Spring Boot整合Spring MVC、 使用Spring Boot整合MyBatis開(kāi)發(fā)、搭建Eureka注冊(cè)中心、Feign、使用Spring Cloud Gateway搭建微服務(wù)網(wǎng)關(guān)。 | 可掌握的核心: 掌握SpringBoot整合SpringMVC開(kāi)發(fā); 掌握SpringBoot整合MyBatis開(kāi)發(fā); 掌握Eureka搭建; 掌握Feign的使用。 可以解決的問(wèn)題: 具備后端數(shù)據(jù)微服務(wù)接口開(kāi)發(fā),可勝任通過(guò)Spring技術(shù)架構(gòu)完成微服務(wù)搭建??赏瓿善髽I(yè)級(jí)數(shù)據(jù)微服務(wù)接口開(kāi)發(fā)。 市場(chǎng)價(jià)值: 可勝任后端開(kāi)發(fā)工程師崗位。 |
Spring Boot | |||
Spring Cloud | |||
實(shí)時(shí)生態(tài)圈 | 分布式緩存系統(tǒng) | Redis原理及架構(gòu)、Redis Cluster原理及架構(gòu)、Redis常用操作、HBase原理及架構(gòu)、預(yù)分區(qū)、LSM結(jié)構(gòu)、Bloom Filter、co-processor、結(jié)合Phoneix進(jìn)行優(yōu)化查詢、Kafka原理及架構(gòu)分析、分布式實(shí)時(shí)計(jì)算架構(gòu)和思想、ElasticSearch開(kāi)發(fā)、Logstash數(shù)據(jù)采集、Kibana數(shù)據(jù)可視化。 | 可掌握的核心: 掌握Redis原理及架構(gòu); 掌握Redis命令操作、及數(shù)據(jù)結(jié)構(gòu); 掌握Hbase原理及架構(gòu); 掌握HBase命令操作、MapReduce編程; 掌握Phoneix二級(jí)索引優(yōu)化查詢; 掌握ELK開(kāi)發(fā)。 可以解決的問(wèn)題: 具備使用Hbase和Redis開(kāi)發(fā)調(diào)優(yōu)能力、ELK海量數(shù)據(jù)處理能力。 市場(chǎng)價(jià)值: 可勝任ELK開(kāi)發(fā)工程師、Hadoop開(kāi)發(fā)工程師等崗位。 |
萬(wàn)億級(jí)NoSQL海量數(shù)據(jù)存儲(chǔ) | |||
分布式流處理平臺(tái) | |||
Elastic Stack | |||
Flink Stream | Flink DataStream的使用、Flink SQL開(kāi)發(fā)、Flink 性能監(jiān)控、Flink調(diào)優(yōu)、Flink SQL執(zhí)行計(jì)劃、Hive + Flink SQL、Kafka + Flink、Watermark、Checkpoint、任務(wù)調(diào)度與負(fù)載均衡、狀態(tài)管理、Flume+Kafka+Flink+Hbase+Sqoop+Canal+MySQL案例實(shí)戰(zhàn)。 | 可掌握的核心能力: 掌握Kafka原理及架構(gòu); 掌握KafkaStreams開(kāi)發(fā); 掌握基于Flink進(jìn)行實(shí)時(shí)和離線數(shù)據(jù)處理、分析; 掌握基于Flink的多流并行處理技術(shù); 掌握千萬(wàn)級(jí)高速實(shí)時(shí)采集技術(shù)。 可解決的現(xiàn)實(shí)問(wèn)題: 具備Kafka消息隊(duì)列開(kāi)發(fā)和調(diào)優(yōu)能力、Flink流式和批量數(shù)據(jù)開(kāi)發(fā)能力。 市場(chǎng)價(jià)值: 可勝任初級(jí)實(shí)時(shí)計(jì)算開(kāi)發(fā)工程師、初級(jí)Flink開(kāi)發(fā)工程師等崗位。 |
|
Flink DataSet | |||
Flink Runtime | |||
Flink SQL | |||
Flink實(shí)戰(zhàn) | |||
項(xiàng)目二(證券、物聯(lián)網(wǎng)任選其一) | 1、實(shí)時(shí)監(jiān)控證券市場(chǎng)的每日業(yè)務(wù)交易,實(shí)現(xiàn)對(duì)證券市場(chǎng)交易數(shù)據(jù)的統(tǒng)計(jì)分析 2、搭建監(jiān)察預(yù)警體系,包括:預(yù)警規(guī)則管理,實(shí)時(shí)預(yù)警,歷史預(yù)警,監(jiān)察歷史數(shù)據(jù)分析等 3、股市行情交易數(shù)據(jù)實(shí)時(shí)采集、實(shí)時(shí)數(shù)據(jù)分析、多維分析,即席查詢,實(shí)時(shí)大屏監(jiān)控展示 |
項(xiàng)目采用流處理計(jì)算引擎Flink,實(shí)時(shí)處理100萬(wàn)筆/s的交易數(shù)據(jù) 基于企業(yè)主流的流處理技術(shù)框架:Flume、Kafka、Flink、Hbase等 基于Hive和Kylin的批數(shù)據(jù)處理,可進(jìn)行海量多維分析 Hbase5日內(nèi)秒級(jí)行情億級(jí)規(guī)模,MySQL5日內(nèi)分時(shí)行情千萬(wàn)級(jí)規(guī)模 T-5日內(nèi)實(shí)時(shí)行情毫秒響應(yīng),T-5日外的歷史行情秒級(jí)響應(yīng) 數(shù)據(jù)存儲(chǔ)以HDFS、Hive、Hbase應(yīng)對(duì)PB級(jí)規(guī)模數(shù)據(jù) 項(xiàng)目涵蓋主流離線數(shù)倉(cāng)的技術(shù)和OLAP分析引擎 OLAP分析引擎以Kylin和Druid實(shí)現(xiàn)離線和實(shí)時(shí)的指標(biāo)分析 隊(duì)列服務(wù)以低延遲、高吞吐-百萬(wàn)筆/秒的Kafka保障數(shù)據(jù)接收 緩存服務(wù)基于Redis的高速緩存,實(shí)現(xiàn)數(shù)據(jù)快速交換 TB級(jí)別的實(shí)時(shí)日處理數(shù)據(jù)、存儲(chǔ)PB級(jí)歷史數(shù)據(jù) 主備雙大數(shù)據(jù)平臺(tái)保障。 |
可掌握的核心能力: 掌握基于FTP、Flume + Kafka的實(shí)時(shí)數(shù)據(jù)采集開(kāi)發(fā); 掌握TB級(jí)海量規(guī)模下Flink實(shí)時(shí)處理開(kāi)發(fā),保證實(shí)時(shí)計(jì)算高容錯(cuò); 掌握三種不同時(shí)間維指標(biāo)的存儲(chǔ)、計(jì)算方案(Druid、MySQL、HBase),例如:毫秒級(jí)\秒級(jí)\分時(shí)等時(shí)間維; 掌握基于Kylin的即席快速OLAP開(kāi)發(fā); 掌握基于Flink CEP的實(shí)時(shí)預(yù)警監(jiān)控開(kāi)發(fā); 掌握基于Spring Boot的數(shù)據(jù)服務(wù)接口開(kāi)發(fā)。 可解決的現(xiàn)實(shí)問(wèn)題: 具備TB級(jí)規(guī)模下毫秒級(jí)Flink實(shí)時(shí)計(jì)算程序開(kāi)發(fā)、架設(shè)能力,并具備不同應(yīng)用場(chǎng)景下多種存儲(chǔ)引擎的技術(shù)引擎優(yōu)化能力。以及項(xiàng)目上線部署、運(yùn)維監(jiān)控能力。 市場(chǎng)價(jià)值: 可勝任實(shí)時(shí)計(jì)算開(kāi)發(fā)工程師、Flink開(kāi)發(fā)工程師、實(shí)時(shí)數(shù)倉(cāng)開(kāi)發(fā)工程師等崗位。 |
Spark技術(shù)棧 | Scala語(yǔ)言 | Scala基礎(chǔ)、變量聲明、數(shù)據(jù)類(lèi)型、條件表達(dá)式、塊表達(dá)式、循環(huán)、方法和函數(shù)、數(shù)組、元組、集合、Iterator、構(gòu)造器、伴生對(duì)象、Akka編程。 | 可掌握的核心: 掌握Scala語(yǔ)言基礎(chǔ)、數(shù)據(jù)結(jié)構(gòu); 掌握Scala語(yǔ)言高階語(yǔ)法特性; 掌握Spark的RDD、DAG、CheckPoint等設(shè)計(jì)思想; 掌握SparkSQL結(jié)構(gòu)化數(shù)據(jù)處理,Spark On Hive整合; 掌握Spark Streaming整合Kafka完成實(shí)時(shí)數(shù)據(jù)處理; 掌握Spark Streaming偏移量管理及Checkpoint; 掌握Structured Streaming整合多數(shù)據(jù)源完成實(shí)時(shí)數(shù)據(jù)處理。 可以解決的問(wèn)題: 具備Spark全棧開(kāi)發(fā)能力,滿足大數(shù)據(jù)行業(yè)多場(chǎng)景統(tǒng)一技術(shù)棧的數(shù)據(jù)開(kāi)發(fā),提供就業(yè)核心競(jìng)爭(zhēng)力。 市場(chǎng)價(jià)值: 可勝任初級(jí)Spark開(kāi)發(fā)工程師、初級(jí)大數(shù)據(jù)平臺(tái)開(kāi)發(fā)工程師、初級(jí)大數(shù)據(jù)開(kāi)發(fā)工程師等崗位。 |
Spark core | Spark架構(gòu)和原理(運(yùn)行機(jī)制、Driver和Executor、spark任務(wù)提交流程)、RDD開(kāi)發(fā)和原理(Partition、Task、RDD的依賴(lài)關(guān)系、RDD的容錯(cuò)機(jī)制、RDD的存儲(chǔ)級(jí)別、RDD的緩存機(jī)制)、廣播變量 、DAG原理(DAG思想、DAG的生成、DAG的處理過(guò)程)。 | ||
Spark sql | Spark SQL架構(gòu)和原理、DataFrame、DataSet DSL和SQL開(kāi)發(fā)、Spark多數(shù)據(jù)源整合(txt、CSV、Json、parquet、JDBC、Hive)、Spark SQL執(zhí)行計(jì)劃原理、Spark SQL性能調(diào)優(yōu)。 | ||
Spark Streaming | Spark Streaming流式開(kāi)發(fā)、DStream API、整合多數(shù)據(jù)源、偏移量管理。 | ||
Structured Streaming | Structured Streaming開(kāi)發(fā)(input、output、window、watermark、過(guò)期數(shù)據(jù)操作、去重等)、Structured Streaming多數(shù)據(jù)源整合(socket、Kafka)、 Flume+kafka+Structured Streaming案例實(shí)戰(zhàn)。 |
||
項(xiàng)目三 (物流、電信任選其一) |
1、基于一家大型物流公司研發(fā)的智慧物流大數(shù)據(jù)平臺(tái),日訂單上千萬(wàn) 2、圍繞訂單、運(yùn)輸、倉(cāng)儲(chǔ)、搬運(yùn)裝卸、包裝以及流通加工等物流環(huán)節(jié)中涉及的數(shù)據(jù)信息等 3、提高運(yùn)輸以及配送效率、減少物流成本、更有效地滿足客戶服務(wù)要求,并針對(duì)數(shù)據(jù)分析結(jié)果,提出具有中觀指導(dǎo)意義的解決方案 |
涵蓋離線業(yè)務(wù)和實(shí)時(shí)業(yè)務(wù)、ClickHouse實(shí)時(shí)存儲(chǔ)和計(jì)算引擎、 Kudu + Impala準(zhǔn)實(shí)時(shí)分析系統(tǒng)、基于Docker搭建異構(gòu)數(shù)據(jù)源、以企業(yè)主流的Spark生態(tài)圈為核心技術(shù)(Spark、Spark SQL、Structured Streaming)、ELK全文檢索、Spring Cloud數(shù)據(jù)微服務(wù)開(kāi)發(fā)、實(shí)時(shí)監(jiān)控地圖開(kāi)發(fā)、存儲(chǔ)和計(jì)算性能調(diào)優(yōu)、還原企業(yè)搭建大數(shù)據(jù)平臺(tái)的完整過(guò)程。 | 可掌握的核心能力: 掌握Docker環(huán)境部署、管理操作; 掌握基于Oracle + MySQL異構(gòu)數(shù)據(jù)源數(shù)據(jù)處理技術(shù); 掌握基于Oracle Golden Gate以及Canal的實(shí)時(shí)采集技術(shù); 掌握Kudu + Spark的快速離線數(shù)據(jù)處理、分析技術(shù); 掌握Kudu + Impala即席數(shù)據(jù)分析技術(shù); 掌握基于ClickHouse高性能存儲(chǔ)、計(jì)算引擎技術(shù); 掌握基于ELK的全文檢索技術(shù); 掌握Kudu、Spark的調(diào)優(yōu)能力; 掌握基于Spring Cloud的數(shù)據(jù)微服務(wù)接口開(kāi)發(fā)技術(shù)。 可解決的現(xiàn)實(shí)問(wèn)題: 具備基于Docker搭建不同數(shù)據(jù)源、實(shí)時(shí)采集開(kāi)發(fā)能力,并具備構(gòu)建高性能數(shù)據(jù)存儲(chǔ)處理大數(shù)據(jù)平臺(tái)開(kāi)發(fā)能力。 市場(chǎng)價(jià)值: 可勝任中級(jí)Spark開(kāi)發(fā)工程師、中級(jí)大數(shù)據(jù)平臺(tái)開(kāi)發(fā)工程師、中級(jí)大數(shù)據(jù)開(kāi)發(fā)工程師等崗位。 |
項(xiàng)目四 (電商、票務(wù)任選其一) |
1、分析來(lái)自全品類(lèi)B2B2C電商系統(tǒng),以電商核心流程為主線進(jìn)行數(shù)據(jù)分析,支撐運(yùn)營(yíng) 2、建立基于用戶的全面分析體系,從多個(gè)維度建立基于用戶的運(yùn)營(yíng)體系 3、實(shí)時(shí)分析用戶訪問(wèn)流量、訂單、店鋪等運(yùn)營(yíng)指標(biāo) |
涵蓋Kettle同步MySQL數(shù)據(jù)采集方案、JS埋點(diǎn) + Flume實(shí)時(shí)用戶點(diǎn)擊行為數(shù)據(jù)采集方案 、Spark on hive數(shù)據(jù)倉(cāng)庫(kù)解決方案、Apache Superset可視化方案、Kylin交互式快速數(shù)據(jù)分析方案、Canal MySQL業(yè)務(wù)數(shù)據(jù)實(shí)時(shí)采集方案、Flink實(shí)時(shí)ETL處理解決方案、Flink + Druid實(shí)時(shí)數(shù)倉(cāng)解決方案、HBase + Phoenix明細(xì)數(shù)據(jù)實(shí)時(shí)查詢方案、Flink CEP實(shí)時(shí)風(fēng)控方案、Azkaban作業(yè)調(diào)度調(diào)度方案。 |
可掌握的核心能力: 掌握Spark + Hive構(gòu)建離線數(shù)倉(cāng); 掌握Kafka + Flink + Druid構(gòu)建實(shí)時(shí)數(shù)倉(cāng); 掌握基于Kettle的數(shù)據(jù)ETL處理技術(shù); 掌握離線數(shù)倉(cāng)和實(shí)時(shí)數(shù)倉(cāng)分層架構(gòu); 掌握基于Parquet + Snappy的存儲(chǔ)、壓縮技術(shù); 掌握Spark處理數(shù)據(jù)傾斜問(wèn)題; 掌握基于Redis + Flink實(shí)時(shí)ETL處理技術(shù); 掌握基于Spark引擎的Kylin Cube構(gòu)建技術(shù); 掌握Kylin的碎片管理、Cube調(diào)優(yōu)、增量構(gòu)建等技術(shù); 掌握基于Flume、Canal的實(shí)時(shí)采集技術(shù); 掌握基于Proto Buf的高效序列化技術(shù); 掌握基于HBase + Phoenix的快速數(shù)據(jù)查詢技術(shù); 掌握基于Flink CEP的實(shí)時(shí)風(fēng)控處理技術(shù); 掌握基于Superset的BI開(kāi)發(fā)技術(shù)。 可解決的現(xiàn)實(shí)問(wèn)題: 具備主流Spark + Hive離線數(shù)倉(cāng)開(kāi)發(fā)技術(shù),并具備海量數(shù)據(jù)處理性能調(diào)優(yōu)能力,具備實(shí)時(shí)數(shù)倉(cāng)架構(gòu)能力,構(gòu)建毫秒級(jí)的實(shí)時(shí)計(jì)算平臺(tái)。 市場(chǎng)價(jià)值: 可勝任高級(jí)離線數(shù)倉(cāng)開(kāi)發(fā)工程師、高級(jí)實(shí)時(shí)數(shù)倉(cāng)開(kāi)發(fā)工程師、高級(jí)大數(shù)據(jù)開(kāi)發(fā)工程等崗位。 |
可選擇線下或線上 | |||
大數(shù)據(jù)平臺(tái)化開(kāi)發(fā) | 大規(guī)模大數(shù)據(jù)集群部署、大規(guī)模集群運(yùn)維監(jiān)控 | 涵蓋主流的一些大數(shù)據(jù)平臺(tái),涵蓋CDH、HDP、Apache、云平臺(tái)等部署方案,引入各家的最佳實(shí)踐。包含基于平臺(tái)下的各個(gè)組件的運(yùn)維,包括Prometheus、Zabbix、Grafana、Eagle、CM、Ambari、Ganglia等。 | 可掌握的核心能力: 掌握大數(shù)據(jù)組件的常用運(yùn)維方法解決實(shí)際的運(yùn)維方案; 掌握大數(shù)據(jù)框架必備的數(shù)據(jù)結(jié)構(gòu)及常用的數(shù)據(jù)結(jié)構(gòu); 掌握企業(yè)級(jí)大數(shù)據(jù)架構(gòu)原理及源碼深入剖析; 掌握PySpark、PyFlink等Python大數(shù)據(jù)生態(tài)技術(shù); 掌握大數(shù)據(jù)數(shù)據(jù)挖掘常見(jiàn)的算法及應(yīng)用場(chǎng)景; 掌握數(shù)據(jù)中臺(tái)構(gòu)建思路及實(shí)戰(zhàn); 掌握數(shù)據(jù)科學(xué)常見(jiàn)的問(wèn)題方法; 掌握大型互聯(lián)網(wǎng)公司常見(jiàn)面試題。 可解決的現(xiàn)實(shí)問(wèn)題: 具備大數(shù)據(jù)平臺(tái)運(yùn)維能力; 具備企業(yè)數(shù)據(jù)中臺(tái)構(gòu)建能力; 具備大數(shù)據(jù)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)模型開(kāi)發(fā)、調(diào)優(yōu)能力; 具備Apache頂級(jí)項(xiàng)目二次開(kāi)發(fā)能力、源碼級(jí)調(diào)優(yōu)開(kāi)發(fā)能力; 具備大型企業(yè)大數(shù)據(jù)平臺(tái)架構(gòu)能力。 市場(chǎng)價(jià)值: 直通BAT等大廠。 |
大數(shù)據(jù)數(shù)據(jù)中臺(tái) | 大數(shù)據(jù)數(shù)據(jù)體系建設(shè)、管理 | 基于Altlas元數(shù)據(jù)管理工具進(jìn)行數(shù)據(jù)血緣分析、構(gòu)建數(shù)據(jù)地圖,構(gòu)建統(tǒng)一存儲(chǔ)計(jì)算平臺(tái),建立數(shù)據(jù)類(lèi)目體系、標(biāo)簽類(lèi)目體系、數(shù)據(jù)資產(chǎn)管理,并基于數(shù)據(jù)中臺(tái)構(gòu)建數(shù)據(jù)應(yīng)用服務(wù)。 | |
大廠解決方案實(shí)戰(zhàn) | 出行、電商、視頻、社交等領(lǐng)域大數(shù)據(jù)解決方案 | 大型門(mén)戶可視化任務(wù)提交解決方案、大型旅游出行服務(wù)平臺(tái)統(tǒng)一性能監(jiān)控平臺(tái)解決方案、B2B2C電商集中實(shí)時(shí)采集消息隊(duì)列存儲(chǔ)方案、出行平臺(tái)實(shí)時(shí)風(fēng)控性能調(diào)優(yōu)方案、大型電商雙十一千萬(wàn)級(jí)實(shí)時(shí)處理調(diào)優(yōu)、視頻網(wǎng)站海量用戶行為數(shù)據(jù)計(jì)算調(diào)優(yōu)。 | |
大數(shù)據(jù)常見(jiàn)架構(gòu)與設(shè)計(jì) | 一線大廠技術(shù)架構(gòu) | 美團(tuán)點(diǎn)評(píng)實(shí)時(shí)數(shù)倉(cāng)架構(gòu)、拼多多離線數(shù)倉(cāng)架構(gòu)、小米快速OLAP分析架構(gòu)、抖音小視頻實(shí)時(shí)推薦架構(gòu)。 | |
新零售項(xiàng)目實(shí)戰(zhàn) | 新零售大數(shù)據(jù)項(xiàng)目實(shí)戰(zhàn),離線實(shí)時(shí)全覆蓋 | 本項(xiàng)目基于國(guó)內(nèi)大型新零售巨頭開(kāi)發(fā)的大數(shù)據(jù)平臺(tái),基于高性能方案構(gòu)建離線數(shù)倉(cāng)、以及實(shí)時(shí)數(shù)倉(cāng)。該項(xiàng)目涵蓋完整的業(yè)務(wù),包括銷(xiāo)售、屢單、會(huì)員、促銷(xiāo)、商品、客戶等主題,每個(gè)主題涵蓋大量真實(shí)的業(yè)務(wù)場(chǎng)景,項(xiàng)目手把手帶著學(xué)生開(kāi)發(fā)基于新零售場(chǎng)景下的離線、實(shí)時(shí)業(yè)務(wù)。本項(xiàng)目采用Hive+Presto架構(gòu)構(gòu)建高性能的離線處理方案,并采用基于ClickHouse的實(shí)時(shí)數(shù)倉(cāng),實(shí)現(xiàn)秒級(jí)OLAP分析。 | |
工業(yè)大數(shù)據(jù)項(xiàng)目實(shí)戰(zhàn) | 制造業(yè)大數(shù)據(jù)項(xiàng)目實(shí)戰(zhàn) | 本項(xiàng)目基于國(guó)內(nèi)大型的設(shè)備制造商大數(shù)據(jù)項(xiàng)目開(kāi)發(fā)。該企業(yè)在全球范圍內(nèi)銷(xiāo)售設(shè)備,設(shè)備涵蓋加油站相關(guān)的所有,例如:加油機(jī)、油罐建設(shè)、加氣機(jī)、自助設(shè)備等設(shè)備生產(chǎn)制造、設(shè)計(jì)、銷(xiāo)售,并提供全球性的服務(wù)。在國(guó)內(nèi)重點(diǎn)客戶為:中國(guó)石油、中國(guó)石化、以及各個(gè)地域的大型企業(yè)。在國(guó)內(nèi),業(yè)務(wù)覆蓋的油站約8W座,設(shè)備數(shù)量50W臺(tái)。拿加油機(jī)設(shè)備來(lái)說(shuō),一臺(tái)設(shè)備包含了眾多的配件,每個(gè)配件的維護(hù),設(shè)備信息的上報(bào),服務(wù)工作人員的調(diào)度、GPS跟蹤定位等,企業(yè)經(jīng)過(guò)多年的經(jīng)營(yíng),積累了海量的數(shù)據(jù)。集群公司為了能夠確保企業(yè)精細(xì)化運(yùn)營(yíng),決定進(jìn)行數(shù)字化轉(zhuǎn)型,依托于大數(shù)據(jù)技術(shù),以客戶、生產(chǎn)、服務(wù)、運(yùn)營(yíng)為核心,打造一個(gè)全方位的數(shù)字化平臺(tái)。 | |
大數(shù)據(jù)數(shù)據(jù)挖掘 | 企業(yè)級(jí)大數(shù)據(jù)數(shù)據(jù)挖掘解決方案 | 機(jī)器學(xué)習(xí)基礎(chǔ)、SparkMl&SparkMllib基礎(chǔ)實(shí)戰(zhàn)、Python核心基礎(chǔ)、Python數(shù)據(jù)科學(xué)庫(kù)基礎(chǔ)(Numpy、Pandas、Matplotlib、Seaborn、Imblearn-Learn、Scikit-Learn)、Python數(shù)據(jù)挖掘案例、PyHdfs、PyHive、PyHbase、Kafka-Python、PySpark、PyFLink案例實(shí)戰(zhàn)。 | |
BAT直通車(chē) | 互聯(lián)網(wǎng)公司常見(jiàn)面試題及應(yīng)用場(chǎng)景剖析 | BAT大數(shù)據(jù)常見(jiàn)的面試精選題、一線大廠多領(lǐng)域場(chǎng)景剖析、HDFS、MapReduce、Hive、Flume、Sqoop等面試題精講、Spark、Spark Streaming等面試題精講、Flink面試題精講、底層數(shù)據(jù)結(jié)構(gòu)面試題精講。 |
備注:該課程大綱僅供參考,實(shí)際課程內(nèi)容可能在授課過(guò)程中發(fā)生更新或變化,具體授課內(nèi)容最終以各班級(jí)課表為準(zhǔn)。
每晚對(duì)學(xué)員當(dāng)天知識(shí)的吸收程度、老師授課內(nèi)容難易程度進(jìn)行評(píng)分,老師會(huì)根據(jù)學(xué)員反饋進(jìn)行分析,對(duì)學(xué)員吸收情況調(diào)整授課內(nèi)容、課程節(jié)奏,最終讓每位學(xué)員都可以跟上班級(jí)學(xué)習(xí)的整體節(jié)奏。
為每個(gè)就業(yè)班都安排了一名優(yōu)秀的技術(shù)指導(dǎo)老師,不管是白天還是晚自習(xí)時(shí)間,隨時(shí)解答學(xué)員問(wèn)題,進(jìn)一步鞏固和加強(qiáng)課上知識(shí)。
為了能輔助學(xué)員掌握所學(xué)知識(shí),黑馬程序員自主研發(fā)了6大學(xué)習(xí)系統(tǒng),包括教學(xué)反饋系統(tǒng)、學(xué)習(xí)難易和吸收分析系統(tǒng)、學(xué)習(xí)測(cè)試系統(tǒng)、在線作業(yè)系統(tǒng)、學(xué)習(xí)任務(wù)手冊(cè)、學(xué)員綜合能力評(píng)定分析等。
末位輔導(dǎo)隊(duì)列的學(xué)員,將會(huì)得到重點(diǎn)關(guān)心。技術(shù)輔導(dǎo)老師會(huì)在學(xué)員休息時(shí)間,針對(duì)學(xué)員的疑惑進(jìn)行知識(shí)點(diǎn)梳理、答疑、輔導(dǎo)。以確保知識(shí)點(diǎn)掌握上沒(méi)有一個(gè)學(xué)員掉隊(duì),真正落實(shí)不拋棄,不放棄任何一個(gè)學(xué)員。
從學(xué)員學(xué)習(xí)中的心態(tài)調(diào)整,到生活中的困難協(xié)助,從課上班級(jí)氛圍塑造到課下多彩的班級(jí)活動(dòng),班主任360度暖心鼓勵(lì)相伴。
小到五險(xiǎn)一金的解釋、面試禮儀的培訓(xùn);大到500強(qiáng)企業(yè)面試實(shí)訓(xùn)及如何針對(duì)性地制定復(fù)習(xí)計(jì)劃,幫助學(xué)員拿到高薪Offer。