Презентация Фокусы. Оптимизация компилятором онлайн

На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему Фокусы. Оптимизация компилятором абсолютно бесплатно. Урок-презентация на эту тему содержит всего 22 слайда. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.

Презентации » Устройства и комплектующие » Фокусы. Оптимизация компилятором

Просмотр ВСЕЙ презентации! ЖМИТЕ

Оцените презентацию от 1 до 5 баллов!

Смотреть онлайн
Скачать

Тип файла:

ppt / pptx (powerpoint)
Всего слайдов:

22 слайда
Для класса:

1,2,3,4,5,6,7,8,9,10,11
Размер файла:

268.20 kB
Просмотров:

48
Скачиваний:

0
Автор:

неизвестен

Слайды и текст к этой презентации:

№1 слайд

Содержание слайда: Есть ли у вас вопросы?

№2 слайд

Содержание слайда: Краткое содержание этой серии Фокусы Оптимизация компилятором

№3 слайд

Содержание слайда: Фокус №1 Создаю глобальный двухмерный массив Заполняю его случайными числами Вычисляю сумму всех элементов: sum += array[i][j] sum += array[j][i] На ПК вариант а быстрее почти в 5 раз! На МК никакой разницы нет. ПОЧЕМУ?

№4 слайд

Содержание слайда: Фокус №1 А как лежит в памяти двумерный массив?

№5 слайд

Содержание слайда:

№6 слайд

Содержание слайда: Все дело в кэш-памяти Зачем нужен кэш? Чтобы ускорить доступ к часто используемым данным, т.к. оперативная память слишком медленная. На МК кэш-памяти нет – поэтому нет никакой разницы между вариантами а и б.

№7 слайд

Содержание слайда: А как работает кэш? Кэш состоит из «линий» (cache lines) - при каждом обращении в память кэшируется несколько последовательных байт (64-128). Если при обращении в память нужный элемент уже есть в кэше, то все хорошо (кэш-попадание). Если нужного элемента в кэше нет – нужно пойти в память и считать линию (кэш-промах). Кэш не бесконечен! Поэтому чтобы записать в него новую линию, нужно стереть старую.

№8 слайд

Содержание слайда: Кэш Вывод? Последовательный доступ к памяти гораздо быстрее, чем случайный. С точки зрения железа самая быстрая структура данных – обычный массив (на не слишком большом количестве данных).

№9 слайд

Содержание слайда: Кэш В современных процессорах есть: кэш данных (D-cache) кэш инструкций (I-cache) буфер ассоциативной трансляции (TLB) Как правило, существует несколько уровней кэша.

№10 слайд

Содержание слайда: Кэш в современном процессоре

№11 слайд

Содержание слайда: Кэш в современном процессоре Время чтения из памяти для Core i7-9xx: L1 - 4 такта. L2 - 11 тактов. L3 - 39 тактов. Основная ОЗУ – 107 тактов.

№12 слайд

Содержание слайда: Кэш Допустим, что два ядра процессора обращаются к одной и той же переменной. Тогда соответствующий кусок памяти будет закэширован дважды в двух кэшах L1. А что будет, если одно ядро что-нибудь в эту переменную запишет? Что тогда прочитает другое ядро? Если доступ к переменной организован правильно, то все будет в порядке. Для программиста кэш в этом смысле «прозрачен». Но за это придется платить скоростью работы..

№13 слайд

Содержание слайда: Кэш Допустим, что два ядра процессора обращаются к двум разным переменным, которые расположены в памяти рядом. Одна и та же кэш-линия опять-таки будет находится в двух кэшах. Прозрачность кэша гарантирует, что значения переменных будут корректными. Но для этого при каждой записи эта линия будет записываться в основную память и читаться опять! И скорость работы программы упадет. Это называется «false sharing» (ложное разделение памяти).

№14 слайд

Содержание слайда: Фокус №1.5 Возьмем неудачный способ сложения элементов массива (по столбцам). Логично предположить, что чем больше массив – тем больше времени занимает его обход. Массив 4100х4100 обходится быстрее чем 4096х4096. Степени двойки – это плохо?

№15 слайд

Содержание слайда: Ассоциативность кэша А как узнать, закэширована переменная или нет? Кэш прямого отображения - каждый адрес памяти может быть закэширован в одно, заранее определенное место в кэше. Легко подвергается конфликтам. Полностью ассоциативный кэш – любая переменная может быть закэширована в любой участок кэша. Очень сложная реализация. Частично ассоциативный кэш – каждая переменная может находится в нескольких, заранее определенных участках кэша. Компромисс, используется на практике.

№16 слайд

Содержание слайда: Частично ассоциативный кэш Например, 16-входовой частично ассоциативный кэш – линии кэша делятся на 16 групп. Каждая переменная входит в одну группу и может входить только в линии кэша из этой группы. Номер группы, как правило, определяется адресом переменной. Переменные с адресами, кратными определенному числу, будут входить в одну группу и соревноваться за одни и те же линии кэша!

№17 слайд

Содержание слайда: Кэш для инструкций Линейный код (без переходов) выполняется быстрее Маленькие программы (которые целиком помещаются в кэш) выполняются быстрее

№18 слайд

Содержание слайда: Выводы При оценке быстродействия алгоритма нужно помнить про кэш. Писать быстродействующие программы – это сложно. Тестировать быстродействие – это сложно (разные процессоры, разные входные данные, «прогрев» кэша..).

№19 слайд

Содержание слайда: Фокус №2 Вариант А: Заполним одномерный массив случайными элементами. Много раз найдем сумму всех элементов больше 128. Вариант Б: Заполним одномерный массив случайными элементами. Отсортируем массив Много раз найдем сумму всех элементов больше 128. На МК вариант Б занимает больше времени. На ПК вариант Б занимает существенно меньше времени. Но почему?

№20 слайд

Содержание слайда: Предсказание переходов Ключевой момент: if (data[c] >= 128) sum += data[c]; Если массив отсортирован – то переходы очень предсказуемы, предсказатель редко ошибается. Если массив не отсортирован – предсказатель ошибается постоянно!

№21 слайд

Содержание слайда: Оптимизация Критерии оптимизации: по объему кода (бинарного файла) по скорости исполнения Иногда можно (и хочется) оптимизировать сразу по двум критериям, но не всегда.

№22 слайд

Содержание слайда: Оптимизация «на пальцах» У компилятора есть некая «область просмотра» (scope), в пределах которой он оптимизирует код: одна строка несколько строк, цикл функция файл весь проект Грубо говоря, чем больше эта область, тем лучше оптимизация.

Скачать все slide презентации Фокусы. Оптимизация компилятором одним архивом:

Скачать

Похожие презентации