課程簡介

介紹

  • Data Science 流程
  • 數據科學家的角色和職責

準備開發環境

  • 庫、框架、語言和工具
  • 本地開發
  • 基於 Web 的協作式開發

數據採集

  • 不同類型的數據
    • 結構
      • 本地資料庫
      • Database 連接器
      • 常見格式:xlxs、XML、Json、csv、...
    • 非結構化
      • 點擊、審查、智能手機
      • 蜜蜂屬
      • Internet of Things (IoT)
      • 文檔、圖片、視頻、聲音
  • 案例研究:持續收集大量非結構化數據

數據存儲

  • 關係資料庫
  • 非關係資料庫
  • Hadoop:分散式文件系統 (HDFS)
  • Spark:彈性分散式資料集 (RDD)
  • 雲存儲

數據準備

  • 攝取、選擇、清理和轉換
  • 確保數據品質 - 正確性、意義和安全性
  • 異常報告

Languages 用於製備、加工和分析

  • R 語言
    • R 簡介
    • 數據操作、計算和圖形顯示
  • Python
    • 介紹 Python
    • 操作、處理、清理和處理數據

數據分析

  • 探索性分析
    • 基本統計數據
    • 草稿可視化
    • 了解數據
  • 因果律
  • 功能和轉換
  • Machine Learning
    • 受監督 vs 無監督
    • 何時使用什麼型號
  • Natural Language Processing (NLP)

Data Visualization

  • 最佳實踐
  • 為正確的數據選擇正確的圖表
  • 調色板
  • 更上一層樓
    • 儀錶板
    • 互動式可視化
  • 用數據講故事

總結和結論

最低要求

  • 對資料庫概念的一般瞭解
  • 對統計學有基本的瞭解
 35 時間:

人數


每位參與者的報價

客戶評論 (3)

Upcoming Courses

課程分類