Презентация Разработка параллельных программ для GPU. Введение в CUDA онлайн

На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему Разработка параллельных программ для GPU. Введение в CUDA абсолютно бесплатно. Урок-презентация на эту тему содержит всего 35 слайдов. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.
Презентации » Устройства и комплектующие » Разработка параллельных программ для GPU. Введение в CUDA



Оцените!
Оцените презентацию от 1 до 5 баллов!
  • Тип файла:
    ppt / pptx (powerpoint)
  • Всего слайдов:
    35 слайдов
  • Для класса:
    1,2,3,4,5,6,7,8,9,10,11
  • Размер файла:
    307.13 kB
  • Просмотров:
    80
  • Скачиваний:
    3
  • Автор:
    неизвестен



Слайды и текст к этой презентации:

№1 слайд
Разработка параллельных
Содержание слайда: Разработка параллельных программ для GPU Введение в CUDA

№2 слайд
АППАРАТНЫЕ Особенности GPU
Содержание слайда: АППАРАТНЫЕ Особенности GPU Краткий обзор архитектурных особенностей GPU

№3 слайд
Основные тенденции Переход к
Содержание слайда: Основные тенденции Переход к многопроцессорным системам Развития технологий параллельного программирования OpenMP, MPI, TPL etc. Простота в использовании

№4 слайд
Классификация архитектур Виды
Содержание слайда: Классификация архитектур Виды параллелизма На уровне данных (Data) На уровне задач (Instruction)

№5 слайд
Архитектура многоядерных CPU
Содержание слайда: Архитектура многоядерных CPU Кэш первого уровня для инструкций (L1-I) для данных (L1-D) Кэш второго уровня на одном кристалле используется раздельно Проблема синхронизации кэш-памяти

№6 слайд
Архитектура GPU Device
Содержание слайда: Архитектура GPU: Device

№7 слайд
Архитектура GPU TPC Кластер
Содержание слайда: Архитектура GPU: TPC Кластер текстурных блоков (TPC) Память для текстур Потоковый мультипроцессор

№8 слайд
Архитектура GPU SM Память
Содержание слайда: Архитектура GPU: SM Память констант Память инструкций Регистровая память Разделяемая память 8 скалярных процессоров 2 суперфункциональных блока

№9 слайд
Основные отличия GPU от CPU
Содержание слайда: Основные отличия GPU от CPU Высокая степень параллелизма (SIMT) Минимальные затраты на кэш-память Ограничения функциональности

№10 слайд
Развитие вычислений на GPU
Содержание слайда: Развитие вычислений на GPU Развитие технологии неграфических вычислений

№11 слайд
Эволюция GPU
Содержание слайда: Эволюция GPU

№12 слайд
GPGPU General-Purpose
Содержание слайда: GPGPU General-Purpose Computation on GPU Вычисления на GPU общего (неграфического) назначения AMD FireStream NVIDIA CUDA DirectCompute (DirectX 10) OpenCL

№13 слайд
Программная модель CUDA
Содержание слайда: Программная модель CUDA Основные понятия и определения CUDA

№14 слайд
CUDA Compute Unified Device
Содержание слайда: CUDA – Compute Unified Device Architecture Host – CPU (Central Processing Unit) Device – GPU (Graphics Processing Unit)

№15 слайд
Организация работы CUDA GPU
Содержание слайда: Организация работы CUDA GPU

№16 слайд
Warp и латентность Warp
Содержание слайда: Warp и латентность Warp Порция потоков для выполнения на потоковом мультипроцессоре (SM) Латентность Общая задержка всех потоков warp’а при выполнении инструкции

№17 слайд
Топология блоков block
Содержание слайда: Топология блоков (block) Возможна 1, 2 и 3-мерная топология Количество потоков в блоке ограничено (512)

№18 слайд
Топология сетки блоков grid
Содержание слайда: Топология сетки блоков (grid) Возможна 1 и 2-мерная топология Количество блоков в каждом измерении ограничено 65536=216

№19 слайд
Адресация элементов данных
Содержание слайда: Адресация элементов данных CUDA предоставляет встроенные переменные, которые идентифицируют блоки и потоки blockIdx blockDim threadIdx

№20 слайд
Барьерная синхронизация
Содержание слайда: Барьерная синхронизация Синхронизация потоков блока осуществляется встроенным оператором __synchronize

№21 слайд
CUDA Расширение C Особенности
Содержание слайда: CUDA: Расширение C++ Особенности написания программ для GPU CUDA

№22 слайд
Расширение языка С Новые типы
Содержание слайда: Расширение языка С++ Новые типы данных Спецификаторы для функций Спецификаторы для переменных Встроенные переменные (для ядра) Директива для запуска ядра

№23 слайд
Процесс компиляции
Содержание слайда: Процесс компиляции

№24 слайд
Типы данных CUDA , , и
Содержание слайда: Типы данных CUDA 1, 2, 3 и 4-мерные вектора базовых типов Целые: (u)char, (u)int, (u)short, (u)long, longlong Дробные: float, double Пример: float(1), float2, float3, float4 dim3 ~ uint3 Пример: dim3(n) = uint(n,1,1)

№25 слайд
Спецификаторы функций
Содержание слайда: Спецификаторы функций

№26 слайд
Спецификаторы функций Ядро
Содержание слайда: Спецификаторы функций Ядро помечается __global__ Ядро не может возвращать значение Возможно совместное использование __host__ и __device__ Спецификаторы __global__ и __host__ не могут использоваться совместно

№27 слайд
Ограничения функций GPU Не
Содержание слайда: Ограничения функций GPU Не поддерживается рекурсия Не поддерживаются static-переменные Нельзя брать адрес функции __device__ Не поддерживается переменное число аргументов

№28 слайд
Спецификаторы переменных
Содержание слайда: Спецификаторы переменных

№29 слайд
Ограничения переменных GPU
Содержание слайда: Ограничения переменных GPU Переменные __shared__ не могут инициализироваться при объявлении Запись в __constant__ может производить только host через CUDA API Спецификаторы нельзя применять к полям структур и union

№30 слайд
Переменные ядра dim gridDim
Содержание слайда: Переменные ядра dim3 gridDim unit3 blockIdx dim3 blockDim uint3 threadIdx int warpSize

№31 слайд
Директива запуска ядра Kernel
Содержание слайда: Директива запуска ядра Kernel<<<blocks, threads>>>(data) blocks – число блоков в сетке threads – число потоков в блоке

№32 слайд
Общая структура программы
Содержание слайда: Общая структура программы CUDA __global__ void Kernel(float* data) { . . . } void main() { . . . Kernel<<<blocks, threads>>>(data); . . . }

№33 слайд
Предустановки Видеокарта
Содержание слайда: Предустановки Видеокарта NVIDIA с поддержкой CUDA Драйвера устройства с поддержкой CUDA NVIDIA CUDA Toolkit NVIDIA CUDA SDK NVIDIA Nsight Visual Studio 2008+ Компилятор Visual C++ 9.0+

№34 слайд
Литература NVIDIA Developer
Содержание слайда: Литература NVIDIA Developer Zone http://developer.nvidia.com/cuda NVIDAI CUDA – Неграфические вычисления на графических процессорах http://www.ixbt.com/video3/cuda-1.shtml Создание простого приложения CUDA в Visual Studio 2010 http://mezhov.blogspot.com/2011/09/cuda-visual-studio-2010.html

№35 слайд
Вопросы?
Содержание слайда: Вопросы?

Скачать все slide презентации Разработка параллельных программ для GPU. Введение в CUDA одним архивом: