Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
課程簡介
介紹
- 什麼是 GPU 程式設計?
- 為什麼要使用 GPU 程式設計?
- GPU 程式設計的挑戰和權衡是什麼?
- GPU 程式設計的框架是什麼?
- 為您的應用程式選擇正確的框架
OpenCL
- 什麼是OpenCL?
- OpenCL的優點和缺點是什麼?
- 為 OpenCL 設置開發環境
- 創建一個執行向量加法的基本 OpenCL 程式
- 使用 OpenCL API 查詢設備資訊、分配和釋放設備記憶體、在主機和設備之間複製數據、啟動內核和同步線程
- 使用 OpenCL C 語言編寫在設備上執行的內核並操作數據
- 使用 OpenCL 內置函數、變數和庫執行常見任務和操作
- 使用 OpenCL 記憶體空間(例如全域、本地、常量和專用)來優化數據傳輸和記憶體訪問
- 使用 OpenCL 執行模型來控制定義並行度的工作項、工作組和 ND 範圍
- 使用 CodeXL 等工具調試和測試 OpenCL 個程式
- 使用合併、緩存、預取和分析等技術優化 OpenCL 個程式
CUDA的
- 什麼是CUDA?
- CUDA的優缺點是什麼?
- 設置 CUDA 的開發環境
- 創建一個執行向量加法的基本 CUDA 程式
- 使用 CUDA API 查詢設備資訊、分配和釋放設備記憶體、在主機和設備之間複製數據、啟動內核和同步線程
- 使用 CUDA C/C++ 語言編寫在設備上執行的內核並操作數據
- 使用 CUDA 內建函數、變數和庫執行常見任務和操作
- 使用 CUDA 記憶體空間(例如全域、共用、常量和本地)來優化數據傳輸和記憶體訪問
- 使用 CUDA 執行模型來控制定義並行度的線程、塊和網格
- 使用 CUDA-GDB、CUDA-MEMCHECK 和 NVIDIA Nsight 等工具調試和測試 CUDA 程式
- 使用合併、緩存、預取和分析等技術優化 CUDA 程式
中華民國
- 什麼是ROCm?
- ROCm的優缺點是什麼?
- 為 ROCm 設定開發環境
- 創建執行向量加法的基本 ROCm 程式
- 使用 ROCm API 查詢設備資訊、分配和釋放裝置記憶體、在主機和設備之間複製數據、啟動內核和同步線程
- 使用 ROCm C/C++ 語言編寫在設備上執行的內核並操作數據
- 使用 ROCm 內建函數、變數和庫執行常見任務和操作
- 使用 ROCm 記憶體空間(如全域、本地、常量和專用)來優化數據傳輸和記憶體訪問
- 使用 ROCm 執行模型來控制定義並行度的線程、塊和網格
- 使用 ROCm Debugger 和 ROCm Profiler 等工具調試和測試 ROCm 程式
- 使用合併、緩存、預取和分析等技術優化 ROCm 程式
比較
- 比較 OpenCL、CUDA 和 ROCm 的功能、性能和相容性
- 使用基準和指標評估 GPU 個程式
- 學習 GPU 程式設計的最佳實踐和技巧
- 探索 GPU 程式設計的當前和未來趨勢和挑戰
摘要和後續步驟
最低要求
- 瞭解 C/C++ 語言和並行程式設計概念
- 計算機體系結構和記憶體層次結構的基礎知識
- 具有命令行工具和代碼編輯器的經驗
觀眾
- 希望學習如何使用不同的框架進行 GPU 程式設計並比較其功能、性能和相容性的開發人員
- 希望編寫可在不同平臺和設備上運行的可移植和可擴展代碼的開發人員
- 希望探索 GPU 程式設計和優化的權衡和挑戰的程式師
28 時間:
客戶評論 (2)
與各種示例非常互動,在培訓開始和結束之間的複雜性進展良好。
Jenny - Andheo
Course - GPU Programming with CUDA and Python
機器翻譯
培訓師精力充沛,幽默風趣。
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Course - NVIDIA GPU Programming - Extended
機器翻譯