課程簡介

介紹

  • Apache Beam 與 MapReduce、Spark Streaming、Kafka Streaming、Storm 和 Flink

安裝與設定Apache Beam

Apache Beam 功能和架構概述

  • 梁模型、SDK、梁管道流道
  • 分散式處理後端

瞭解 Apache Beam Programming 模型

  • 管道的執行方式

運行示例管道

  • 準備 WordCount 管道
  • 在本地執行 Pipeline

設計管道

  • 規劃結構、選擇轉換以及確定輸入和輸出方法

創建管道

  • 編寫驅動程式並定義管道
  • 使用 Apache Beam 類
  • 數據集、轉換、I/O、數據編碼等

執行管道

  • 在本地、遠端電腦和公共雲上執行管道
  • 選擇運行器
  • 特定於 Runner 的配置

測試和除錯 Apache Beam

  • 使用類型提示模擬靜態類型
  • 管理 Python 管道依賴項

處理有界和無界數據集

  • 視窗化和觸發器

使您的管道可重用且可維護

創建新的數據源和接收器

  • Apache Beam 源 API 和接收器 API

將 Apache Beam 與其他 Big Data 系統集成

  • 阿帕奇 Hadoop, Apache Spark, Apache Kafka

故障排除

總結和結論

最低要求

  • Python Programming 的經驗。
  • 使用 Linux 命令行的經驗。

觀眾

  • 開發人員
 14 時間:

人數


每位參與者的報價

Upcoming Courses

課程分類