課程簡介
- Machine Learning 引言
- 機器學習的類型——監督學習與無監督學習
- 從統計學習到機器學習
- Data Mining 工作流:
- Business 理解
- 數據理解
- 數據準備
- 造型
- 評估
- 部署
- 機器學習演算法
- 為問題選擇適當的演算法
- ML 中的過擬合和偏差-方差權衡
- ML 庫和程式設計語言
- 為什麼要使用程式設計語言
- 在 R 和 Python 之間進行選擇
- Python 速成班
- Python 資源
- Python 機器學習庫
- Jupyter 筆記本和互動式編碼
- 測試 ML 演算法
- 泛化和過擬合
- 避免過擬合
- 維持法
- 交叉驗證
- Bootstrap平
- 評估數值預測
- 精度測量:ME、MSE、RMSE、MAPE
- 參數和預測穩定性
- 評估分類演算法
- 準確性及其問題
- 混淆矩陣
- 班級不平衡問題
- 可視化模型性能
- 利潤曲線
- ROC曲線
- 提升曲線
- 選型
- 模型調優 – 網格搜索策略
- Python 中的示例
- 數據準備
- 數據導入和存儲
- 了解數據 – 基本探索
- 使用 pandas 庫進行數據操作
- 數據轉換 – 數據整理
- 探索性分析
- 缺失觀測值 – 檢測和解決方案
- 異常值 – 檢測和策略
- 標準化、歸一化、二值化
- 定性數據重新編碼
- Python 中的示例
- 分類
- 二元分類與多類分類
- 通過數學函數進行分類
- 線性判別函數
- 二次判別函數
- Logistic回歸和概率方法
- K - 最近鄰
- 樸素貝葉斯
- 決策樹
- 車
- 裝袋
- Random Forest秒
- 提高
- Xgboost的
- 支援向量機和內核
- 最大邊距分類器
- 支援向量機
- 集成學習
- Python 中的示例
- 回歸和數值預測
- 最小二乘估計
- 變數選擇技術
- 正則化和穩定性 - L1、L2
- 非線性和廣義最小二乘法
- 多項式回歸
- 回歸樣條曲線
- 回歸樹
- Python 中的示例
- 無監督學習
- 聚類
- 基於質心的聚類 – k-means、k-medoids、PAM、CLARA
- 分層聚類 – Diana, Agnes
- 基於模型的聚類 - EM
- 自組織地圖
- 集群評估和評估
- 降維
- 主成分分析和因數分析
- 奇異值分解
- 多維縮放
- Python 中的示例
- 聚類
- 文本挖掘
- 預處理數據
- 詞袋模型
- 詞幹提取和詞形還原
- 分析詞頻
- 情感分析
- 創建詞雲
- Python 中的示例
- 推薦引擎和協同過濾
- 推薦數據
- 基於使用者的協同過濾
- 基於專案的協同過濾
- Python 中的示例
- 關聯模式挖掘
- 頻繁項集演算法
- 市場籃子分析
- Python 中的示例
- 異常值分析
- 極值分析
- 基於距離的異常值檢測
- 基於密度的方法
- 高維異常值檢測
- Python 中的示例
- Machine Learning 案例研究
- Business 問題理解
- 數據預處理
- 演算法選擇和調優
- 對調查結果的評估
- 部署
最低要求
對 Machine Learning 基礎知識的知識和認識
客戶評論 (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Course - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Course - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback