Презентация Машина опорных векторов. Лабораторная работа 5 онлайн
На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему Машина опорных векторов. Лабораторная работа 5 абсолютно бесплатно. Урок-презентация на эту тему содержит всего 35 слайдов. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.
Презентации » Устройства и комплектующие » Машина опорных векторов. Лабораторная работа 5
Оцените!
Оцените презентацию от 1 до 5 баллов!
- Тип файла:ppt / pptx (powerpoint)
- Всего слайдов:35 слайдов
- Для класса:1,2,3,4,5,6,7,8,9,10,11
- Размер файла:2.28 MB
- Просмотров:116
- Скачиваний:0
- Автор:неизвестен
Слайды и текст к этой презентации:
№2 слайд
Содержание слайда: Бизнес-задача
Задача – отличить фальшивые банкноты от настоящих
База Banknote authentification: https://archive.ics.uci.edu/ml/datasets/banknote+authentication
Объекты представляют из себя характеристики изображений банкнот
1372 объекта
4 признака:
энтропия изображения
коэффициенты дисперсии, ассиметрии и эксцесса вейвлет-преобразования изображения
Класс (фальшивые или настоящие)
№3 слайд
Содержание слайда: Бизнес-задача
Способ решения – классификация
Метод классификации – SVM (Support Vector Machine)
Положительные стороны SVM:
быстрый метод классификации;
метод сводится к решению задачи квадратичного программирования в выпуклой области, которая обычно имеет единственное решение;
метод позволяет осуществлять более уверенную классификацию, чем другие линейные методы.
№4 слайд
Содержание слайда: Метод Support Vector Machine
Изобретён в 1963 году, авторы – Вапник, Червоненкис
Современная постановка в 1995 году
Классификатор – разделяющая гиперплоскость
Гиперплоскость является наилучшей в смысле ширины «разделяющей полосы»
Точки на границах «полосы» называются «опорными» - отсюда название
В чём смысл увеличивать ширину полосы?
№6 слайд
Содержание слайда: Математическая постановка
Пусть даны два линейно разделимых класса объектов
Мы можем описать все точки разделяющей гиперплоскости используя вектор-нормаль к этой гиперплоскости:
Данная разделяющая гиперплоскость находится в «разделяющей полосе», которую мы также можем задать уравнениями:
№13 слайд
Содержание слайда: Использование метода SVM
Использован набор данных Banknote Authentification
В качестве тестовой выборки взяты 107 последних объектов класса «0» (настоящие банкноты) и 119 объектов класса «1» (фальшивки). Остальные объекты используются в качестве обучающей выборки.
Исходные параметры алгоритмов SVM взяты одинаковыми для разных библиотек.
№24 слайд
Содержание слайда: Результаты вычислений для данных Banknote Authentification
Результаты вычислений (суммарное время получения модели + предсказание, количество ошибок):
DAAL: ~2.5 секунды, 2 ошибки
Python: ~0.014 секунды, 0 ошибок
R: ~0.065 секунды, 1 ошибка
Почему результаты получились разные?
№25 слайд
Содержание слайда: Результаты вычислений для данных Banknote Authentification
Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с ядром radial и стандартными параметрами(200 MB кэш, большое количество итераций):
DAAL: ~0.024 секунды, 0 ошибок
Python: ~0.007 секунды, 0 ошибок
R: ~0.065 секунды, 1 ошибка
№26 слайд
Содержание слайда: Результаты вычислений для данных Banknote Authentification
Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с ядром radial и одинаковыми заданными параметрами (gamma = 1,iterations = no_limit):
DAAL: ~0.035 секунды, 0 ошибок
Python: ~0.061 секунды, 0 ошибок
R: ~0.052 секунды, 0 ошибок
№30 слайд
Содержание слайда: Результаты вычислений для данных Adult Income
Результаты вычислений:
DAAL: ~400 секунд, точность 0.63 (линейное ядро, после бинаризации, 200000 итераций, точность 0.001)
Python: ~20 секунд, точность 0.75(линейное ядро, после бинаризации, 100000 итераций, точность 0.001, сходимость не достигнута)
Python: ~40 секунд, точность 0.56(линейное ядро, после бинаризации, 200000 итераций, точность 0.001, сходимость не достигнута)
Python: ~2400 секунд, точность 0.79(линейное ядро, после бинаризации, без ограничения на количество итераций, точность 0.001, сходимость достигнута)
Python ~150 секунд, точность 0.75(ядро rbf, после бинаризации, 100000 итераций, точность 0.001, сходимость достигнута)
R: ~64 секунды, точность 0.848 (ядро rbf, без бинаризации)
R: ~430 секунд, точность 0.839 (ядро rbf, после бинаризации)
R: ~80 секунд, точность 0.846 (ядро linear, без бинаризации)
№32 слайд
Содержание слайда: Плюсы и минусы SVM
Плюсы:
это наиболее быстрый метод нахождения решающих функций;
метод сводится к решению задачи квадратичного программирования в выпуклой области, которая всегда имеет единственное решение;
метод находит разделяющую полосу максимальной ширины (для заданных параметров), что позволяет в дальнейшем осуществлять более уверенную классификацию (и интерпретацию);
Минусы
метод чувствителен к шумам и стандартизации данных;
не существует общего подхода к автоматическому выбору ядра, его параметров и построению спрямляющего подпространства в целом в случае линейной неразделимости классов.
№33 слайд
Содержание слайда: Практическое задание
Проанализировать разные результаты для набора данных Banknote Authentification, в чём разница базовых настроек алгоритма в разных инструментах?
Найти наилучшие параметры для данных Banknote Authentification, используя технику кросс-валидации.
Возможно ли улучшить точность алгоритма для данных Adult Income, используя другие параметры (gamma, C, параметры связанные с SVM)? Подобрать параметры, дающие большую точность или показать, что для большого набора параметров точность улучшить не удаётся.
№34 слайд
Содержание слайда: Ссылки на реализации алгоритма
http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf - LIBSVM: A Library for Support Vector Machines, Chih-Chung Chang and Chih-Jen Lin; статья с описанием реализации SVM – модели, алгоритмы(R,Python).
http://www.csie.ntu.edu.tw/~cjlin/papers/quadworkset.pdf - Working Set Selection Using Second Order Information for Training Support Vector Machines, Rong-En Fan, Pai-Hsuen Chen, Chih-Jen Lin; статья с более детальным описанием реализации SVM(R,DAAL).
Скачать все slide презентации Машина опорных векторов. Лабораторная работа 5 одним архивом:
-
Лабораторная работа. Параллельные алгоритмы матрично-векторного умножения
-
Простейшие способы шифрования текста. Основы программирования Лабораторная работа 11
-
Функции ОС для работы с векторами прерываний
-
Процедуры и функции, создаваемые пользователем. Лабораторная работа 11
-
Решение задач в Mathcad и Excel. Использование функции IF (ЕСЛИ). Лабораторная работа 1
-
Основы программирования. Работа с консолью. While. Вложенные циклы. Лабораторная работа
-
Лабораторная работа. СКУД с функцией запрета двойного прохода
-
Система проведения курсов с автоматизированной проверкой лабораторных работ по программированию
-
Массивы, коллекции (лабораторные работы)
-
Реализовать программу, реализующую игру FizzBuzz (лабораторная работа )