課程簡介

Google Colab 和 Apache Spark 簡介

  • Google Colab 概述
  • Apache Spark 簡介
  • 在 Google Colab 中設置 Spark

使用 Apache Spark 進行數據處理

  • 使用 RDD 和 DataFrame
  • 載入和處理大型數據集
  • 使用 Spark SQL 查詢結構化數據

使用Spark進行高級分析

  • 使用Spark MLlib進行機器學習
  • 執行實時數據分析
  • 使用Spark進行分散式計算

可視化和 Google Colab 中的 Collaboration

  • 將 Colab 與流行的視覺化庫整合
  • 使用 Colab 筆記本的協作工作流
  • 共用和匯出結果

優化 Big Data 工作流程

  • 優化Spark的性能
  • 優化記憶體和存儲使用方式
  • 擴展大型數據集的工作流

Big Data 在雲中

  • 將 Google Colab 與基於雲端的工具整合
  • 將雲存儲用於大數據
  • 在分散式雲環境中使用Spark

案例研究和最佳實踐

  • 實際大數據應用回顧
  • 使用 Apache Spark 和 Colab 的案例研究
  • 大數據分析的最佳實踐

總結和後續步驟

最低要求

  • 數據科學概念的基礎知識
  • 熟悉 Apache Spark
  • Python 程式設計技能

觀眾

  • 數據科學家
  • 數據工程師
  • 使用大數據的研究人員
 14 時間:

人數


每位參與者的報價

客戶評論 (5)

Upcoming Courses

課程分類