Презентация Моделирование и анализ параллельных вычислений. онлайн
На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему Моделирование и анализ параллельных вычислений. абсолютно бесплатно. Урок-презентация на эту тему содержит всего 28 слайдов. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.
Презентации » Образование » Моделирование и анализ параллельных вычислений.
Оцените!
Оцените презентацию от 1 до 5 баллов!
- Тип файла:ppt / pptx (powerpoint)
- Всего слайдов:28 слайдов
- Для класса:1,2,3,4,5,6,7,8,9,10,11
- Размер файла:1.36 MB
- Просмотров:53
- Скачиваний:0
- Автор:неизвестен
Слайды и текст к этой презентации:
№2 слайд
![Эффективность параллельных](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img1.jpg)
Содержание слайда: Эффективность параллельных вычислений
Жесткие требования к эффективности определены задачами (экология, аэродинамика, геофизика, геном и др.):
исследуемые объекты – 3D,
для приемлемой точности нужна сетка > 103 узлов,
в каждом узле надо найти значения > 10 функций,
при изучении динамики объекта определить его состояние в 102-104 моментах времени,
на вычисление каждого результата в среднем приходится 102-103 арифметических действий,
вычисления могут циклически повторяться для уточнения результата.
№3 слайд
![Зачем нужны модели и их](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img2.jpg)
Содержание слайда: Зачем нужны модели и их анализ?
Для разработки эффективных параллельных алгоритмов оценивают эффективность использования параллелизма:
эффективность распараллеливания конкретных выбранных методов выполнения вычислений,
максимально возможное ускорение процесса решения задачи
(анализируются все возможные способы выполнения вычислений).
Для этого нужны формальные модели вычислений
№4 слайд
![Модель вычислений Граф](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img3.jpg)
Содержание слайда: Модель вычислений
Граф «операции – операнды» описывает алгоритм вычислений на уровне операций и информационных зависимостей.
Предположения упрощенной модели:
Время выполнения всех вычислительных операций = const = 1.
Передача данных между PU выполняется мгновенно
(например, в системе в общей памятью)
можно не учитывать коммуникационную трудоемкость алгоритмов
№6 слайд
![Определение графа](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img5.jpg)
Содержание слайда: Определение
графа «операции-операнды» (граф О-О)
G = (V , R)
V – множество вершин графа, представляющих выполняемые операции алгоритма.
R – множество дуг графа, определяющих последовательность операций.
Дуга r(i,j) принадлежит графу G только,
если операция j использует результат выполнения операции i
Вершины без входных дуг могут использоваться для указания операций ввода
Вершины без выходных дуг – для указания операций вывода.
№9 слайд
![Оценки трудоемкости](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img8.jpg)
Содержание слайда: Оценки трудоемкости параллельных алгоритмов
Speedup - ускорение за счёт параллельного выполнения на N процессорах (потоках)
a(N) = T(1) / T(N)
Efficiency - эффективность системы из N процессоров
E(N) = a(N) / N
Scalability - масштабируемость системы (возможность ускорения вычислений пропорционально числу процессоров,
т.е. линейное ускорение)
a(N)=N
a(N)>N – суперлинейное ускорение
№13 слайд
![Оценка эффективности](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img12.jpg)
Содержание слайда: Оценка эффективности
Количество итераций (уровней) каскадной схемы:
k = log2n
(на рисунке при n=4, k=2)
Общее количество операций суммирования по всем уровням
без распараллеливания
(равно количеству суммирований для последовательной схемы):
Kпосл = n/2 + n/4 + …+ 1 = n - 1
Общее количество операций суммирования
с распараллеливанием (равно количеству итераций):
Kпар = log2n
№14 слайд
![Оценка эффективности Время](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img13.jpg)
Содержание слайда: Оценка эффективности
Время выполнения на 1 процессоре (равно количеству операций):
Т1 = Kпосл
Время выполнения на р процессорах (равно количеству итераций):
Тр = Kпар
Ускорение:
a(p) = Т1 /Тр = (n – 1)/log2n
Эффективность:
E(p) = a(p)/p = (n – 1)/(p * log2n)
Для реализации вычислительной схемы необходимо n/2 процессоров
E(p) = a(p)/p = (n – 1)/((n/2) * log2n)
lim E(p) = 0 при р → ∞
№15 слайд
![Улучшение каскадной схемы](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img14.jpg)
Содержание слайда: Улучшение каскадной схемы
Цель – асимптотически ненулевая эффективность.
Суть алгоритма:
все суммируемые значения подразделяются на (n/log2n) групп, в каждой из которых содержится (log2n) элементов;
для каждой группы вычисляется (параллельно) сумма значений при помощи последовательного алгоритма суммирования;
для полученных (n/log2n) сумм отдельных групп применяется обычная каскадная схема.
№16 слайд
![Улучшение каскадной схемы](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img15.jpg)
Содержание слайда: Улучшение каскадной схемы
Пример при n=16:
все суммируемые значения подразделяются на (n/log2n)=4 группы, в каждой из которых содержится (log2n)=4 элемента;
для каждой группы вычисляется (параллельно) сумма значений при помощи последовательного алгоритма суммирования;
для полученных (n/log2n)=4 сумм отдельных групп применяется обычная каскадная схема.
№18 слайд
![Оценка эффективности Для](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img17.jpg)
Содержание слайда: Оценка эффективности
Для этапа 1
число параллельных операций k1 = log2n
необходимое число процессоров р1= n/log2n
Для этапа 2
число параллельных операций k2 = log2(n/log2n) ≤ log2n
необходимое число процессоров р2= р1 /2 = (n/log2n)/2
Время выполнения на р = р1 процессорах:
Тр = k1 + k2 ≤ 2 log2n
Ускорение (меньше в 2 раза):
a(p) = Т1 /Тр = (n – 1)/2 log2n
Эффективность (асимптотически ненулевая):
E(p) = a(p)/p = (n – 1)/2 plog2n = (n – 1)/2n
lim E(p) = 0.5 при р → ∞
№20 слайд
![Передача данных.](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img19.jpg)
Содержание слайда: Передача данных.
Коммуникационная трудоемкость алгоритмов
В рассмотренных оценках не учтены затраты времени на передачу данных.
Основа для характеристики передачи данных – алгоритмы маршрутизизации (АМ).
АМ определяет путь передачи данных
от CPU1 (источника сообщения)
до CPU2 (адресата доставки).
Классификация АМ:
Оптимальные (определяют кратчайшие пути передачи данных) и неоптимальные АМ.
Адаптивные (учитывают загрузку каналов связи) и неадаптивные АМ.
№21 слайд
![Пример оптимальных АМ](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img20.jpg)
Содержание слайда: Пример оптимальных АМ
Алгоритмы, основанные на покоординатной маршрутизации (dimension ordered routing) – поочередный поиск путей передачи данных для каждой размерности топологии сети.
Пример: алгоритм ХY-маршрутизации для решетки:
Передача данных по горизонтали до пересечения с вертикалью CPU2
Передача данных по вертикали и т.д.
№23 слайд
![Характеристики](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img22.jpg)
Содержание слайда: Характеристики коммуникационной составляющей длительности выполнения параллельного алгоритма в МВС
Время передачи данных определяют:
Время начальной подготовки сообщения для передачи, поиска маршрута в сети – tн
Время передачи служебных данных (заголовок сообщения, диагностический блок) между соседними CPU (имеющими между собой физический канал передачи данных) – tс
Время передачи одного байта по одному каналу
(определяется полосой пропускания каналов сети) – tк =1/R,
где R - ширина полосы
№24 слайд
![Методы передачи данных .](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img23.jpg)
Содержание слайда: Методы передачи данных
1. Метод передачи сообщений как неделимых блоков информации (store-and-forward routing, SFR):
CPU1
Готовит данные (сообщение) для передачи
Определяет CPU2 для пересылки (промежуточный)
Запускает операцию пересылки данных
CPU2
Принимает полностью все пересылаемые данные
Выполняет пересылку далее по маршруту
Время пересылки m байт по маршруту длины l (через l узлов) :
tпд = tн + (mtк + tс )l
Для «длинных» сообщений, где можно пренебречь пересылкой служебных данных:
tпд = tн +mtкl
№25 слайд
![Методы передачи данных .](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img24.jpg)
Содержание слайда: Методы передачи данных
2. Метод передачи пакетов – сообщение состоит из блоков информации (пакетов) (cut-through-routing, CTR)
CPU1
Готовит данные (сообщение) в виде пакетов для передачи
Определяет CPU2 для пересылки (промежуточный)
Запускает операцию пересылки пакетов
CPU2
Принимает пакет
Выполняет пересылку далее по маршруту как только получил и обработал заголовок (учитывает tс)
Время пересылки m байт по маршруту длины l :
tпд = = tн + mtк + tсl
№26 слайд
![Преимущества и недостатки CTR](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img25.jpg)
Содержание слайда: Преимущества и недостатки CTR
Ускоряет пересылку данных.
Снижает потребность в памяти для хранения пересылаемых данных и организации приема-передачи сообщений.
Для передачи могут использоваться одновременно разные коммуникационные каналы.
Требует разработки более сложного аппаратного и программного обеспечения сети.
Может увеличить накладные расходы (время подготовки и время передачи служебных данных),
При передаче пакетов возможно возникновение конфликтных ситуаций.
№27 слайд
![Классификация операций](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img26.jpg)
Содержание слайда: Классификация операций передачи данных в МВС
передача данных (сообщений):
между двумя CPU сети,
от одного CPU всем остальным CPU сети,
от всех CPU всем CPU сети,
то же для различных наборов данных;
прием данных (сообщений):
на один CPU от всех CPU сети,
на каждом CPU от всех CPU сети,
то же для различных сообщений.
№28 слайд
![Оценки трудоемкости для](/documents_5/5e80365adbdbe2fda9c2ba851a142b60/img27.jpg)
Содержание слайда: Оценки трудоемкости для различных топологий
Топология Диаметр
Граф 1
Звезда 2
Линейка р - 1
Кольцо р/2
Решетка (2D) 2(√р - 1)
Диаметр – определяет время передачи данных, max расстояние между 2 CPU сети (расстояние равно величине кратчайшего пути).
Для оценки нужно:
Определить алгоритм пересылки.
В формулы вместо l подставить значение диаметра
Скачать все slide презентации Моделирование и анализ параллельных вычислений. одним архивом:
Похожие презентации
-
Моделирование и анализ параллельных вычислений. Коммуникационная трудоемкость параллельных алгоритмов.
-
ЛЕКЦИЯ 8 КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ. МОДЕЛИРОВАНИЕ СВЯЗЕЙ.
-
Визуальное моделирование при анализе и проектировании систем
-
Введение в параллельные и распределенные вычисления
-
Технологии параллельных и распределенных вычислений
-
Технологии параллельных вычислений
-
Анализ параллельно соединенных RL, RC, RLC элементов символическим методом расчёта
-
РАЗРАБОТКА И ВНЕДРЕНИЕ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ АНАЛИЗА И ПРОГНОЗИРОВАНИЯ ПРОИЗВОДСТВЕННЫХ СИТУАЦИЙ ДОМЕННОГО ЦЕХА С ЦЕЛЬЮ ПО
-
Технология моделирования в начальной школе Сложным является сообщение учащимся знаний, так как их объем из года в год увеличивает
-
Компьютерное моделирование в электронных таблицах. - презентация