Презентация Моделирование и анализ параллельных вычислений. онлайн

На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему Моделирование и анализ параллельных вычислений. абсолютно бесплатно. Урок-презентация на эту тему содержит всего 28 слайдов. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.

Презентации » Образование » Моделирование и анализ параллельных вычислений.

Просмотр ВСЕЙ презентации! ЖМИТЕ

Оцените презентацию от 1 до 5 баллов!

Смотреть онлайн
Скачать

Тип файла:

ppt / pptx (powerpoint)
Всего слайдов:

28 слайдов
Для класса:

1,2,3,4,5,6,7,8,9,10,11
Размер файла:

1.36 MB
Просмотров:

53
Скачиваний:

0
Автор:

неизвестен

Слайды и текст к этой презентации:

№1 слайд

Содержание слайда: 2. Моделирование и анализ параллельных вычислений. Модели вычислений. Оценки эффективности параллельных алгоритмов. Коммуникационная трудоемкость параллельных алгоритмов.

№2 слайд

Содержание слайда: Эффективность параллельных вычислений Жесткие требования к эффективности определены задачами (экология, аэродинамика, геофизика, геном и др.): исследуемые объекты – 3D, для приемлемой точности нужна сетка > 103 узлов, в каждом узле надо найти значения > 10 функций, при изучении динамики объекта определить его состояние в 102-104 моментах времени, на вычисление каждого результата в среднем приходится 102-103 арифметических действий, вычисления могут циклически повторяться для уточнения результата.

№3 слайд

Содержание слайда: Зачем нужны модели и их анализ? Для разработки эффективных параллельных алгоритмов оценивают эффективность использования параллелизма: эффективность распараллеливания конкретных выбранных методов выполнения вычислений, максимально возможное ускорение процесса решения задачи (анализируются все возможные способы выполнения вычислений). Для этого нужны формальные модели вычислений

№4 слайд

Содержание слайда: Модель вычислений Граф «операции – операнды» описывает алгоритм вычислений на уровне операций и информационных зависимостей. Предположения упрощенной модели: Время выполнения всех вычислительных операций = const = 1. Передача данных между PU выполняется мгновенно (например, в системе в общей памятью)  можно не учитывать коммуникационную трудоемкость алгоритмов

№5 слайд

Содержание слайда: Определение графа «операции-операнды» (граф О-О) Граф О-О G = (V , R) – ациклический ориентированный (направленный) граф - в нем отсутствуют пути, начинающиеся и кончающиеся в одной и той же вершине.

№6 слайд

Содержание слайда: Определение графа «операции-операнды» (граф О-О) G = (V , R) V – множество вершин графа, представляющих выполняемые операции алгоритма. R – множество дуг графа, определяющих последовательность операций. Дуга r(i,j) принадлежит графу G только, если операция j использует результат выполнения операции i Вершины без входных дуг могут использоваться для указания операций ввода Вершины без выходных дуг – для указания операций вывода.

№7 слайд

Содержание слайда: Пример модели вычислений (S прямоугольника)

№8 слайд

Содержание слайда: Комментарии к модели Можно выбрать иную схему вычислений и построить другую модель. Операции, между которыми нет пути, можно выполнять параллельно (сначала все «*», потом «-»)

№9 слайд

Содержание слайда: Оценки трудоемкости параллельных алгоритмов Speedup - ускорение за счёт параллельного выполнения на N процессорах (потоках) a(N) = T(1) / T(N) Efficiency - эффективность системы из N процессоров E(N) = a(N) / N Scalability - масштабируемость системы (возможность ускорения вычислений пропорционально числу процессоров, т.е. линейное ускорение) a(N)=N a(N)>N – суперлинейное ускорение

№10 слайд

Содержание слайда: Граф О-О и показатели эффективности для типовых задач Алгоритмы вычисления сумм

№11 слайд

Содержание слайда: Последовательный алгоритм S=0; S+=x1; … Возможно только последовательное выполнение, распараллеливание данного алгоритма выполнить нельзя.

№12 слайд

Содержание слайда: Каскадная схема Возможно распараллеливание алгоритма суммирования

№13 слайд

Содержание слайда: Оценка эффективности Количество итераций (уровней) каскадной схемы: k = log2n (на рисунке при n=4, k=2) Общее количество операций суммирования по всем уровням без распараллеливания (равно количеству суммирований для последовательной схемы): Kпосл = n/2 + n/4 + …+ 1 = n - 1 Общее количество операций суммирования с распараллеливанием (равно количеству итераций): Kпар = log2n

№14 слайд

Содержание слайда: Оценка эффективности Время выполнения на 1 процессоре (равно количеству операций): Т1 = Kпосл Время выполнения на р процессорах (равно количеству итераций): Тр = Kпар Ускорение: a(p) = Т1 /Тр = (n – 1)/log2n Эффективность: E(p) = a(p)/p = (n – 1)/(p * log2n) Для реализации вычислительной схемы необходимо n/2 процессоров  E(p) = a(p)/p = (n – 1)/((n/2) * log2n)  lim E(p) = 0 при р → ∞

№15 слайд

Содержание слайда: Улучшение каскадной схемы Цель – асимптотически ненулевая эффективность. Суть алгоритма: все суммируемые значения подразделяются на (n/log2n) групп, в каждой из которых содержится (log2n) элементов; для каждой группы вычисляется (параллельно) сумма значений при помощи последовательного алгоритма суммирования; для полученных (n/log2n) сумм отдельных групп применяется обычная каскадная схема.

№16 слайд

Содержание слайда: Улучшение каскадной схемы Пример при n=16: все суммируемые значения подразделяются на (n/log2n)=4 группы, в каждой из которых содержится (log2n)=4 элемента; для каждой группы вычисляется (параллельно) сумма значений при помощи последовательного алгоритма суммирования; для полученных (n/log2n)=4 сумм отдельных групп применяется обычная каскадная схема.

№17 слайд

Содержание слайда: Модифицированная каскадная схема

№18 слайд

Содержание слайда: Оценка эффективности Для этапа 1 число параллельных операций k1 = log2n необходимое число процессоров р1= n/log2n Для этапа 2 число параллельных операций k2 = log2(n/log2n) ≤ log2n необходимое число процессоров р2= р1 /2 = (n/log2n)/2 Время выполнения на р = р1 процессорах: Тр = k1 + k2 ≤ 2 log2n Ускорение (меньше в 2 раза): a(p) = Т1 /Тр = (n – 1)/2 log2n Эффективность (асимптотически ненулевая): E(p) = a(p)/p = (n – 1)/2 plog2n = (n – 1)/2n lim E(p) = 0.5 при р → ∞

№19 слайд

Содержание слайда: Выводы Неочевидность приемов распараллеливания Неочевидность оценок эффективности Возможность разных вариантов параллельных схем Наглядность модели на графах

№20 слайд

Содержание слайда: Передача данных. Коммуникационная трудоемкость алгоритмов В рассмотренных оценках не учтены затраты времени на передачу данных. Основа для характеристики передачи данных – алгоритмы маршрутизизации (АМ). АМ определяет путь передачи данных от CPU1 (источника сообщения) до CPU2 (адресата доставки). Классификация АМ: Оптимальные (определяют кратчайшие пути передачи данных) и неоптимальные АМ. Адаптивные (учитывают загрузку каналов связи) и неадаптивные АМ.

№21 слайд

Содержание слайда: Пример оптимальных АМ Алгоритмы, основанные на покоординатной маршрутизации (dimension ordered routing) – поочередный поиск путей передачи данных для каждой размерности топологии сети. Пример: алгоритм ХY-маршрутизации для решетки: Передача данных по горизонтали до пересечения с вертикалью CPU2 Передача данных по вертикали и т.д.

№22 слайд

Содержание слайда:

№23 слайд

Содержание слайда: Характеристики коммуникационной составляющей длительности выполнения параллельного алгоритма в МВС Время передачи данных определяют: Время начальной подготовки сообщения для передачи, поиска маршрута в сети – tн Время передачи служебных данных (заголовок сообщения, диагностический блок) между соседними CPU (имеющими между собой физический канал передачи данных) – tс Время передачи одного байта по одному каналу (определяется полосой пропускания каналов сети) – tк =1/R, где R - ширина полосы

№24 слайд

Содержание слайда: Методы передачи данных 1. Метод передачи сообщений как неделимых блоков информации (store-and-forward routing, SFR): CPU1 Готовит данные (сообщение) для передачи Определяет CPU2 для пересылки (промежуточный) Запускает операцию пересылки данных CPU2 Принимает полностью все пересылаемые данные Выполняет пересылку далее по маршруту Время пересылки m байт по маршруту длины l (через l узлов) : tпд = tн + (mtк + tс )l Для «длинных» сообщений, где можно пренебречь пересылкой служебных данных: tпд = tн +mtкl

№25 слайд

Содержание слайда: Методы передачи данных 2. Метод передачи пакетов – сообщение состоит из блоков информации (пакетов) (cut-through-routing, CTR) CPU1 Готовит данные (сообщение) в виде пакетов для передачи Определяет CPU2 для пересылки (промежуточный) Запускает операцию пересылки пакетов CPU2 Принимает пакет Выполняет пересылку далее по маршруту как только получил и обработал заголовок (учитывает tс) Время пересылки m байт по маршруту длины l : tпд = = tн + mtк + tсl

№26 слайд

Содержание слайда: Преимущества и недостатки CTR Ускоряет пересылку данных. Снижает потребность в памяти для хранения пересылаемых данных и организации приема-передачи сообщений. Для передачи могут использоваться одновременно разные коммуникационные каналы. Требует разработки более сложного аппаратного и программного обеспечения сети. Может увеличить накладные расходы (время подготовки и время передачи служебных данных), При передаче пакетов возможно возникновение конфликтных ситуаций.

№27 слайд

Содержание слайда: Классификация операций передачи данных в МВС передача данных (сообщений): между двумя CPU сети, от одного CPU всем остальным CPU сети, от всех CPU всем CPU сети, то же для различных наборов данных; прием данных (сообщений): на один CPU от всех CPU сети, на каждом CPU от всех CPU сети, то же для различных сообщений.

№28 слайд

Содержание слайда: Оценки трудоемкости для различных топологий Топология Диаметр Граф 1 Звезда 2 Линейка р - 1 Кольцо р/2 Решетка (2D) 2(√р - 1) Диаметр – определяет время передачи данных, max расстояние между 2 CPU сети (расстояние равно величине кратчайшего пути). Для оценки нужно: Определить алгоритм пересылки. В формулы вместо l подставить значение диаметра

Скачать все slide презентации Моделирование и анализ параллельных вычислений. одним архивом:

Скачать

Похожие презентации