Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
課程簡介
介紹
- Apache Beam 與 MapReduce、Spark Streaming、Kafka Streaming、Storm 和 Flink
安裝與設定Apache Beam
Apache Beam 功能和架構概述
- 梁模型、SDK、梁管道流道
- 分散式處理後端
瞭解 Apache Beam Programming 模型
- 管道的執行方式
運行示例管道
- 準備 WordCount 管道
- 在本地執行 Pipeline
設計管道
- 規劃結構、選擇轉換以及確定輸入和輸出方法
創建管道
- 編寫驅動程式並定義管道
- 使用 Apache Beam 類
- 數據集、轉換、I/O、數據編碼等
執行管道
- 在本地、遠端電腦和公共雲上執行管道
- 選擇運行器
- 特定於 Runner 的配置
測試和除錯 Apache Beam
- 使用類型提示模擬靜態類型
- 管理 Python 管道依賴項
處理有界和無界數據集
- 視窗化和觸發器
使您的管道可重用且可維護
創建新的數據源和接收器
- Apache Beam 源 API 和接收器 API
將 Apache Beam 與其他 Big Data 系統集成
- 阿帕奇 Hadoop, Apache Spark, Apache Kafka
故障排除
總結和結論
最低要求
- Python Programming 的經驗。
- 使用 Linux 命令行的經驗。
觀眾
- 開發人員
14 時間: