課程簡介

Apache Iceberg 簡介

  • Apache Iceberg 概述
  • 基本概念回顧

深入瞭解冰山架構

  • 深入分析Iceberg的表格格式
  • 詳細的體系結構概述,包括元數據和文件佈局
  • 架構和分區演變的內部結構

高級安裝和配置

  • 配置 Iceberg 以在不同環境中實現最佳性能
  • 與各種數據處理引擎集成
  • 高級設置:安全、加密和訪問控制
  • 在分散式環境中設置 Iceberg

高級運維

  • 管理大型 Iceberg 表
  • 實施和管理複雜的架構更改
  • 處理分區演變和隱藏分區
  • 具有架構和分區更改的高級 CRUD 操作

查詢優化技術

  • 減少查詢延遲的技術
  • 分區修剪和檔修剪
  • 元數據快取和優化策略
  • 實現和測試查詢優化技術

大型數據集的性能調優

  • 優化大規模數據集的性能
  • 使用 Iceberg 的內置功能進行性能調優
  • 實際場景中性能調優的案例研究
  • 優化大規模數據集的性能

高級數據遷移和集成

  • 從其他系統遷移複雜的數據結構
  • 將 Iceberg 與實時數據流集成
  • 遷移複雜數據集並集成實時數據流

可靠性和一致性

  • 確保分散式環境中的數據一致性和完整性
  • 實施和管理交易擔保
  • 處理故障和恢復機制
  • 實現可靠性和一致性功能

高級功能和定製

  • 自訂目錄實現
  • 使用自定義功能擴展 Iceberg
  • 實現自定義目錄並擴展 Iceberg 功能

數據 Governance and compliance

  • 實施數據治理策略
  • 遵守數據法規
  • 管理審計跟蹤和數據沿襲
  • 實現治理和合規性功能

摘要和後續步驟

最低要求

  • 熟悉核心概念、基本操作、冰山表管理

觀眾

  • 數據工程師
  • 數據架構師
  • 數據分析師
  • 軟體開發人員
 21 時間:

人數


每位參與者的報價

客戶評論 (3)

Upcoming Courses

課程分類