課程簡介

  1. Machine Learning 引言
    • 機器學習的類型——監督學習與無監督學習
    • 從統計學習到機器學習
    • Data Mining 工作流:
      • Business 理解
      • 數據理解
      • 數據準備
      • 造型
      • 評估
      • 部署
    • 機器學習演算法
    • 為問題選擇適當的演算法
    • ML 中的過擬合和偏差-方差權衡
  2. ML 庫和程式設計語言
    • 為什麼要使用程式設計語言
    • 在 R 和 Python 之間進行選擇
    • Python 速成班
    • Python 資源
    • Python 機器學習庫
    • Jupyter 筆記本和互動式編碼
  3. 測試 ML 演算法
    • 泛化和過擬合
    • 避免過擬合
      • 維持法
      • 交叉驗證
      • Bootstrap平
    • 評估數值預測
      • 精度測量:ME、MSE、RMSE、MAPE
      • 參數和預測穩定性
    • 評估分類演算法
      • 準確性及其問題
      • 混淆矩陣
      • 班級不平衡問題
    • 可視化模型性能
      • 利潤曲線
      • ROC曲線
      • 提升曲線
    • 選型
    • 模型調優 – 網格搜索策略
    • Python 中的示例
  4. 數據準備
    • 數據導入和存儲
    • 了解數據 – 基本探索
    • 使用 pandas 庫進行數據操作
    • 數據轉換 – 數據整理
    • 探索性分析
    • 缺失觀測值 – 檢測和解決方案
    • 異常值 – 檢測和策略
    • 標準化、歸一化、二值化
    • 定性數據重新編碼
    • Python 中的示例
  5. 分類
    • 二元分類與多類分類
    • 通過數學函數進行分類
      • 線性判別函數
      • 二次判別函數
    • Logistic回歸和概率方法
    • K - 最近鄰
    • 樸素貝葉斯
    • 決策樹
      • 裝袋
      • Random Forest秒
      • 提高
      • Xgboost的
    • 支援向量機和內核
      • 最大邊距分類器
      • 支援向量機
    • 集成學習
    • Python 中的示例
  6. 回歸和數值預測
    • 最小二乘估計
    • 變數選擇技術
    • 正則化和穩定性 - L1、L2
    • 非線性和廣義最小二乘法
    • 多項式回歸
    • 回歸樣條曲線
    • 回歸樹
    • Python 中的示例
  7. 無監督學習
    • 聚類
      • 基於質心的聚類 – k-means、k-medoids、PAM、CLARA
      • 分層聚類 – Diana, Agnes
      • 基於模型的聚類 - EM
      • 自組織地圖
      • 集群評估和評估
    • 降維
      • 主成分分析和因數分析
      • 奇異值分解
    • 多維縮放
    • Python 中的示例
  8. 文本挖掘
    • 預處理數據
    • 詞袋模型
    • 詞幹提取和詞形還原
    • 分析詞頻
    • 情感分析
    • 創建詞雲
    • Python 中的示例
  9. 推薦引擎和協同過濾
    • 推薦數據
    • 基於使用者的協同過濾
    • 基於專案的協同過濾
    • Python 中的示例
  10. 關聯模式挖掘
    • 頻繁項集演算法
    • 市場籃子分析
    • Python 中的示例
  11. 異常值分析
    • 極值分析
    • 基於距離的異常值檢測
    • 基於密度的方法
    • 高維異常值檢測
    • Python 中的示例
  12. Machine Learning 案例研究
    • Business 問題理解
    • 數據預處理
    • 演算法選擇和調優
    • 對調查結果的評估
    • 部署

最低要求

對 Machine Learning 基礎知識的知識和認識

 21 時間:

人數


每位參與者的報價

客戶評論 (3)

Upcoming Courses

課程分類