課程簡介

spark.mllib:數據類型、演算法和實用程式

  • 數據類型
  • 基本統計數據
    • 匯總統計數據
    • 相關性
    • 分層抽樣
    • 假設檢驗
    • 流顯著性檢驗
    • 隨機數據生成
  • 分類和回歸
    • 線性模型(SVM、邏輯回歸、線性回歸)
    • 樸素貝葉斯
    • 決策樹
    • 樹的系綜(Random Forest 和 Gradient-Boosted Trees)
    • 等滲回歸
  • 協同過濾
    • 交替最小二乘法 (ALS)
  • 聚類
    • k 均值
    • 高斯混合物
    • 冪反覆運算集群 (PIC)
    • 潛在狄利克雷分配 (LDA)
    • 將 k 均值一分為二
    • 流式處理 K-Means
  • 降維
    • 奇異值分解 (SVD)
    • 主成分分析 (PCA)
  • 特徵提取和轉換
  • 頻繁的模式挖掘
    • FP 增長
    • 關聯規則
    • 前綴跨度
  • 評估指標
  • PMML 模型導出
  • 優化(開發者)
    • 隨機梯度下降
    • 記憶體受限 BFGS (L-BFGS)

spark.ml:ML 管道的高級 API

  • 概述:估算器、轉換器和管道
  • 提取、轉換和選擇特徵
  • 分類和回歸
  • 聚類
  • 高級主題

最低要求

瞭解以下其中一項知識:

  • 爪哇島
  • Scala
  • 火花R。
 35 時間:

人數


每位參與者的報價

客戶評論 (1)

Upcoming Courses

課程分類