Презентация КЛАСТЕРНЫЙ АНАЛИЗ онлайн
На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему КЛАСТЕРНЫЙ АНАЛИЗ абсолютно бесплатно. Урок-презентация на эту тему содержит всего 27 слайдов. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.
Презентации » Образование » КЛАСТЕРНЫЙ АНАЛИЗ
Оцените!
Оцените презентацию от 1 до 5 баллов!
- Тип файла:ppt / pptx (powerpoint)
- Всего слайдов:27 слайдов
- Для класса:1,2,3,4,5,6,7,8,9,10,11
- Размер файла:214.50 kB
- Просмотров:62
- Скачиваний:0
- Автор:неизвестен
Слайды и текст к этой презентации:
№1 слайд
![КЛАСТЕРНЫЙ АНАЛИЗ Постановка](/documents_5/2f40c62f24f51d4284f956a481212016/img0.jpg)
Содержание слайда: КЛАСТЕРНЫЙ АНАЛИЗ
Постановка задачи группировки данных
Задача состоит в том ,чтобы на основании данных , находящихся в множестве Х разбить их на m групп таким образом , чтобы
Такое разбиение должно отвечать некоторому критерию сходства, т.е. элементы из одного класса отвечают критерию сходства, а элементы из разных классов- нет.
Имеется некоторая целевая функция, которая определяет правило, по которому мы относим элементы к тому или иному классу. Предполагается, что каждый элемент относится строго к одному классу- это детерминированная постановка задачи.
Кластеризация может быть и нечетной. Может быть вероятностная постановка задачи кластеризации.
Существует задача разделения смесей, когда по совместной выборке необходимо оценить характеристики классов.
Мы будем рассматривать кластерный анализ в детерминированном смысле.
Задача классификации может решаться очень успешно, если вначале провести кластеризацию.
№2 слайд
![Задача кластеризации Задача](/documents_5/2f40c62f24f51d4284f956a481212016/img1.jpg)
Содержание слайда: Задача кластеризации:
Задача кластеризации:
1)Изучение данных
2)Использование кластеров для более правильного решения задачи классификации.
На чем базируется задача кластеризации:
Результат кластеризации зависит от критерия, по которому будет проходить кластеризация. Большинство методов основано на понятии расстояния между объектами.
№6 слайд
![Свойство расстояния](/documents_5/2f40c62f24f51d4284f956a481212016/img5.jpg)
Содержание слайда: Свойство расстояния Махланобиса:
Свойство расстояния Махланобиса:
заданы
это расстояние обладает свойством инвариантности по отношению к линейному преобразованию.
(Нужно доказать свойство инвариантности. Выписать формулы
и т.д.)
Если имеется m объектов, то можно определить матрицу расстояний между этими объектами для каждой пары xi и xj
Условно обозначим
№8 слайд
![Если то rij определяется](/documents_5/2f40c62f24f51d4284f956a481212016/img7.jpg)
Содержание слайда: Если то rij определяется немного не так.
Если то rij определяется немного не так.
Меру сходства очень просто построить из меры расстояния:
Фактически это обратная функция
Может быть мера сходства для бинарных объектов , которая определяется следующим образом:
-число совпадений единиц (если все совпадают, то Sij =1,если нет, то Sij =0)
nij -число совпадений нулей
№10 слайд
![Расстояние по принципу](/documents_5/2f40c62f24f51d4284f956a481212016/img9.jpg)
Содержание слайда: Расстояние по принципу дальнего соседа(т.е. рассматриваются наиболее удаленные точки между объектами)
Расстояние по принципу дальнего соседа(т.е. рассматриваются наиболее удаленные точки между объектами)
Расстояние между центрами тяжести (или между математическими ожиданиями)
средний вектор.
Расстояние по принципу средней связи.
№12 слайд
![Есть критерий, основанный на](/documents_5/2f40c62f24f51d4284f956a481212016/img11.jpg)
Содержание слайда: Есть критерий, основанный на матрице рассеивания: матрица рассеивания определяется следующим образом:
Есть критерий, основанный на матрице рассеивания: матрица рассеивания определяется следующим образом:
Где Si -матрица рассеяния внутри группы, Sw – суммарная матрица рассеяния внутри группы.
Есть понятия расстояния между группами:
где -общее среднее, ST – общее рассеивание
№14 слайд
![Основные типы кластерных](/documents_5/2f40c62f24f51d4284f956a481212016/img13.jpg)
Содержание слайда: Основные типы кластерных процедур. Основные задачи кластерного анализа
Задачи могут быть классифицированы по объему выборки .
1) Малые выборки (10-100 объектов)
2) Большие выборки (100-1000 и больше объектов)
Задачи кластеризации с точки зрения априорной информации:
1) Число кластеров априорно задано
2)Число кластеров априорно не задано и их нужно определить
3)Число кластеров априорно не задано, но не требуется их точно определять в процессе обработки информации
Имеются следующие виды процедур:
1)Иерархические. Они отличаются большим объемом вычислений.
2)Параллельные процедуры. На каждом шагу анализируется вся выборка.
3)Процедуры последовательного типа: на каждом шагу анализируется один элемент выборки. Цель-минимизация некоторого функционала разбиения.
№19 слайд
![Базовая процедура](/documents_5/2f40c62f24f51d4284f956a481212016/img18.jpg)
Содержание слайда: Базовая процедура кластеризации (базовая минимальная квадратичная ошибка)
1) выбирается некоторое первоначальное разделение по группам .
x1,x2,…xc Пусть с известно.
Вычисляем I и средние m1,m2,…mc .
Цикл:
2) выбрать следующую выборку кандидата на передвижение
3) если Ni =1 , то перейти к следующему, иначе вычислить:
4) Передвинуть x в ХК ,если для всех I
5) Вновь вычислить I =
№22 слайд
![Описание процедуры Базовые](/documents_5/2f40c62f24f51d4284f956a481212016/img21.jpg)
Содержание слайда: Описание процедуры: Базовые изоданные
1. Выбираем некоторые начальные значения для средних
2. Классифицируем n-выборок, разбивая их на классы по ближайшим соседям
3. Вновь вычисляем среднее как среднее значение выборок в своем классе.
4. Если какое-либо среднее изменило значение, переходим в Цикл, иначе остановка
5. остановка.
№23 слайд
![Алгоритм К - внутригрупповых](/documents_5/2f40c62f24f51d4284f956a481212016/img22.jpg)
Содержание слайда: Алгоритм К - внутригрупповых средних (это базовые и заданные)
Этот алгоритм минимизирует сумму квадратов расстояний всех точек, входящих в кластерную область, до центра кластера структура алгоритма состоит из к-шагов.
Шаг 1. Выбираем К исходных центров кластеров
Этот выбор производится произвольно и обычно в качестве исходных центров кластеров используем первые к- результатов выборки из заданного множества образов.
Шаг 2. На к-том шаге итерации заданное множество образов {x} распределяется по к- кластерам по правилу мин расстояния:
для всех i=1,2… к: , Sj(k) - множество образов, входящих в кластер с центром zj(k)
В случае равенства решения принимается произвольным образом
№24 слайд
![Шаг . На основе результатов](/documents_5/2f40c62f24f51d4284f956a481212016/img23.jpg)
Содержание слайда: Шаг 3. На основе результатов шага 2 принимаются новые центры кластеров
Шаг 3. На основе результатов шага 2 принимаются новые центры кластеров
zj(k+1), j=1,2,…k. Исходя из условия, что сумма квадратов расстояний между всеми образами принадлежит множеству Sj(k) и новым центрам кластера д.б. минимально,
таким образом, новый центр кластера выбирается так, чтобы минимизировать показатель качества
центр zj(k+1), обеспечивающий минимизацию показателя качества, является, в сущности, выборочным средним, определенным по множеству Sj(k). Как
Nj- число выборочных образов, входящих в множество Sj(k)
№26 слайд
![Агломеративная процедура](/documents_5/2f40c62f24f51d4284f956a481212016/img25.jpg)
Содержание слайда: Агломеративная процедура
Имеется N выборок. В начале полагается, что С=N
x1, x2, x3, … xN
* * * … *
Используем матрицу взаимных расстояний, т.к. каждый кластер состоит из 1-го элемента
Ищутся классы, ближайшие по данной ветке. Получаем следующее разбиение S(2), которой соответствует расстояние и так далее:
Но на каком-то этапе можем получить довольно устойчивую кластеризацию.
№27 слайд
![Базовую процедуру](/documents_5/2f40c62f24f51d4284f956a481212016/img26.jpg)
Содержание слайда: Базовую процедуру кластеризации можно сформулировать следующим образом:
Базовую процедуру кластеризации можно сформулировать следующим образом:
С- количество кластеров
1) Пусть , N - количество элементов выборок
цикл:
2) Если , то остановка
- заданное количество кластеров, текущее количество кластеров
3) Найти ближайшую пару кластеров xi , xj
4) Объединяем xi и xj и уничтожаем хi . Положить -1
5) Переход к циклу.
Аналогично можно осуществлять эту процедуру и снизу.
Скачать все slide презентации КЛАСТЕРНЫЙ АНАЛИЗ одним архивом:
Похожие презентации
-
Синдромы поражения бронхов. Кластерный анализ
-
РАЗРАБОТКА И ВНЕДРЕНИЕ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ АНАЛИЗА И ПРОГНОЗИРОВАНИЯ ПРОИЗВОДСТВЕННЫХ СИТУАЦИЙ ДОМЕННОГО ЦЕХА С ЦЕЛЬЮ ПО
-
Морфологический анализ слова Задания А10,В2. - презентация
-
1 Анализ эффективности продвижения компании в интернете Интернет как эффективный инструмент работы на внутреннем и внешнем рынка
-
Методы стратегического анализа
-
РАЗРАБОТКА И ВНЕДРЕНИЕ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ АНАЛИЗА И ПРОГНОЗИРОВАНИЯ ПРОИЗВОДСТВЕННЫХ СИТУАЦИЙ ДОМЕННОГО ЦЕХА С ЦЕЛЬЮ
-
Морфологический анализ слова Задания А10,В2
-
Анализ эффективности продвижения компании в интернете Интернет как эффективный инструмент работы на внутреннем и внешнем рынка
-
На тему "Методические рекомендации по составлению аналитической справки по итогам мониторинга" - скачать презен
-
Модуль анализа и планирования содержания учебных курсов для LCMS 1С:Электронное обучение. Конструктор курсов И. О. Семенов, Г. С. Сиг