8月3-5日再次成功為中國銀聯定制大數據平臺搭建與高性能計算最佳實戰培訓。甫崎咨詢一直是中國銀聯最為可靠的IT培訓供應商。
本次定制培訓通過一個完整的大數據開發項目及一組實際項目訓練案例,完全覆蓋Hadoop與Spark生態系統平臺的應用開發與運維實踐。課堂實踐項目以項目小組的形式進行沙盤實操練習,重點強化理解Hadoop與Spark大數據項目各個階段的工作重點,同時掌握作為大數據項目管理者的基本技術與業務素養。
大數據技術基礎
大數據的產生背景與發展歷程
大數據的4V特征,以及與云計算的關系
大數據應用需求以及潛在價值分析
業界*新的大數據技術發展態勢與應用趨勢
大數據項目的系統與技術選型,及落地實施的挑戰
“互聯網 ”時代下的電子商務、制造業、零售批發、電信運營商、互聯網金融業、電子政務、移動互聯網、教育信息化等行業實踐與應用案例介紹
業界主流的大數據技術方案
大數據軟硬件系統全棧與關鍵技術介紹
主流的大數據解決方案介紹
Apache大數據平臺方案剖析
CDH大數據平臺方案剖析
HDP大數據平臺方案剖析
大數據解決方案與傳統數據庫方案比較
大數據計算模型(一)——批處理MapReduce
MapReduce產生背景與適用場景
MapReduce計算模型的基本原理
MapReduce作業執行流程
MapReduce基本組件,JobTracker和TaskTracker
MapReduce高級編程應用,Combiner和Partitioner
MapReduce性能優化技巧
MapReduce案例分析與開發實踐操作
大數據存儲系統與應用實踐
分布式文件系統HDFS產生背景與適用場景
HDFS master-slave系統架構與工作原理
HDFS核心組件技術講解
HDFS高可用**機制
HDFS集群的安裝、部署與配置,熟練HDFS shell命令操作
分布式小文件存儲系統的平臺架構、核心技術與應用場景
分布式對象存儲系統的平臺架構、核心技術與應用場景
Hadoop框架與生態發展,以及應用實踐操作
Hadoop的發展歷程
Hadoop大數據生態圈系統與工具全貌介紹
Hadoop 1.0的核心組件與適用范圍
Hadoop 2.0的核心組件YARN工作原理,以及與Hadoop 1.0的區別
Hadoop資源管理與作業調度機制
Hadoop常用性能優化技術
Hadoop集群安裝與部署實踐,以及MapReduce程序在YARN上執行
大數據計算模型(二)——實時處理/內存計算 Spark
MapReduce計算模型的瓶頸
Spark產生動機、基本概念與適用場景
Spark編程模型與RDD彈性分布式數據集的工作原理與機制
Spark實時處理平臺運行架構與核心組件
Spark容錯機制、Spark作業調度機制、Scala開發介紹與實踐
Spark集群部署與配置實踐,Spark開發環境構建,Spark案例程序分析,Spark程序開發與運行,Spark與Hadoop集群集成實踐
大數據倉庫查詢技術Hive、SparkSQL、Impala,以及應用實踐
基于MapReduce的大型分布式數據倉庫Hive基礎知識與應用場景
Hive數據倉庫的平臺架構與核心技術剖析
Hive metastore的工作機制與應用
Hive數據倉庫實踐:Hive集群安裝部署,數據倉庫表導入導出與分區操作,Hive SQL操作,Hive客戶端操作
基于Spark的大型分布式數據倉庫SparkSQL基礎知識與應用場景
Spark SQL實時數據倉庫的實現原理與工作機制
SparkSQL應用分析與操作實踐
基于MPP的大型分布式數據倉庫Impala基礎知識與應用場景
Impala實時查詢系統平臺架構、關鍵技術剖析
Hadoop集群運維監控工具
Hadoop大數據運維監控管理系統HUE平臺介紹
Hadoop運維管理監控系統Ambari工具介紹
第三方運維系統與工具Ganglia, Nagios
大數據計算模型(三)——流處理Storm, SparkStreaming
流數據處理應用場景與流數據處理的特點
流數據處理工具Storm的平臺架構與集群工作原理
Storm關鍵技術與并發機制
Storm編程模型與基本開發模式
Storm數據流分組
Storm可靠性**與Acker機制
Storm應用案例分析與實踐:Storm集群安裝部署,Storm程序開發運行操作實踐,Storm與Hadoop集群的集成
流數據處理工具Spark Streaming基本概念與數據模型
Spark Streaming工作機制
大數據ETL操作工具,與大數據分布式采集系統
Hadoop與DBMS之間數據交互工具的應用
Sqoop導入導出數據的工作原理,以及Sqoop工具的安裝部署與實踐操作,利用Sqoop實現MySQL與Hadoop集群之間的數據導入導出交互
Flume-NG數據采集系統的數據流模型與系統架構
Kafka分布式消息訂閱系統的應用介紹與平臺架構,及其使用模式
面向OLTP型應用的NoSQL數據庫及應用實踐
關系型數據庫瓶頸,以及NoSQL數據庫的發展,概念,分類,及其在半結構化和非結構化數據場景下的適用范圍
列存儲NoSQL數據庫HBase簡介與數據模型剖析
HBase分布式集群系統架構與讀寫機制,ZooKeeper分布式協調服務系統的工作原理與應用
HBase表設計模式與primary key設計規范
HBase分布式集群安裝、部署與操作實踐
文檔NoSQL數據庫MongoDB簡介與數據模型剖析
MongoDB集群模式、讀寫機制與常用API操作
Cassandra分布式數據庫的平臺架構以及關鍵技術
Cassandra一致性哈希算法與數據分布策略,以及NWR策略
鍵值型NoSQL數據庫Redis簡介與數據模型剖析
Redis多實例集群架構與關鍵技術
NewSQL數據庫技術簡介及其適用場景
大數據項目選型、實施、優化等問題交流討論
大數據項目的需求分析、應用實施、系統優化,以及解決方案等咨詢與交流討論