課程簡介
Google Colab 和 Apache Spark 簡介
- Google Colab 概述
- Apache Spark 簡介
- 在 Google Colab 中設置 Spark
使用 Apache Spark 進行數據處理
- 使用 RDD 和 DataFrame
- 載入和處理大型數據集
- 使用 Spark SQL 查詢結構化數據
使用Spark進行高級分析
- 使用Spark MLlib進行機器學習
- 執行實時數據分析
- 使用Spark進行分散式計算
可視化和 Google Colab 中的 Collaboration
- 將 Colab 與流行的視覺化庫整合
- 使用 Colab 筆記本的協作工作流
- 共用和匯出結果
優化 Big Data 工作流程
- 優化Spark的性能
- 優化記憶體和存儲使用方式
- 擴展大型數據集的工作流
Big Data 在雲中
- 將 Google Colab 與基於雲端的工具整合
- 將雲存儲用於大數據
- 在分散式雲環境中使用Spark
案例研究和最佳實踐
- 實際大數據應用回顧
- 使用 Apache Spark 和 Colab 的案例研究
- 大數據分析的最佳實踐
總結和後續步驟
最低要求
- 數據科學概念的基礎知識
- 熟悉 Apache Spark
- Python 程式設計技能
觀眾
- 數據科學家
- 數據工程師
- 使用大數據的研究人員
客戶評論 (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
我喜歡 Pablo 的風格,他涵蓋了很多主題,從報告設計、html 定製到實現簡單的 ML 演算法。Good 平衡理論資訊/練習。Pablo 真的涵蓋了我感興趣的所有主題,並全面回答了我的問題。
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
機器翻譯
Actual application of spotfire and all basic functions.
Michael Capili - STMicroelectronics, Inc.
Course - Introduction to Spotfire
The thing I liked the most about the training was the organization and the location