Оцените презентацию от 1 до 5 баллов!
Тип файла:
ppt / pptx (powerpoint)
Всего слайдов:
26 слайдов
Для класса:
1,2,3,4,5,6,7,8,9,10,11
Размер файла:
410.00 kB
Просмотров:
64
Скачиваний:
0
Автор:
неизвестен
Слайды и текст к этой презентации:
№1 слайд
Содержание слайда: Тема 6.
Критерий согласия и таблицы сопряженности
6.1. Критерий согласия
6.2. Таблицы сопряженности
6.3. Проверка независимости качественных признаков
№2 слайд
Содержание слайда: 6.1.
Критерий согласия
№3 слайд
Содержание слайда: Пример. Вкусовые предпочтения
Маркетолог хочет узнать, какому из пяти вкусов нового напитка отдают предпочтение покупатели. Ниже приведены данные, полученные из опроса 100 человек:
Если нет каких-либо особых вкусовых предпочтений, то каждый вид напитка покупают с одинаковой частотой. В таком случае каждая частота должна быть равна 100/5 = 20, то есть приблизительно по 20 человек выберут каждый вид сока.
№4 слайд
Содержание слайда: Наблюдаемые и ожидаемые частоты
Наблюдаемые частоты - частоты полученные по выборке.
Ожидаемые частоты - частоты, полученные путем вычисления на основе теоретических представлений о предполагаемом распределении.
№5 слайд
Содержание слайда: Что проверяет критерий согласия
Критерий согласия позволяет выяснить, насколько согласуются между собой наблюдаемые частоты и ожидаемые, иными словами, существенны или нет различия между ними.
Гипотезы для примера с предпочтениями запишутся так:
Н0: У покупателей нет предпочтений по поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Необходимые условия
1. Выборка случайна.
2. Наблюдаемая частота должна быть не меньше 5.
№6 слайд
Содержание слайда: Статистика
Для проверки гипотезы используется статистика :
Н – наблюдаемая частота
О – ожидаемая частота
Если значение X велико, гипотезу Н0 следует отвергнуть (расхождения между наблюдаемыми и ожидаемыми частотами значительны)
Для уточнения понятия «велико надо» знать распределение X.
В условиях нулевой гипотезы статистика имеет 2-распределение с числом степеней свободы df = n – 1 (где n – число слагаемых в сумме)
№7 слайд
Содержание слайда: Вид 2 распределения
В зависимости от числа степеней свободы n вид распределения изменяется. При увеличении n распределение приближается к нормальному.
№8 слайд
Содержание слайда: Критическая область
Этот критерий имеет только правостороннюю критическую область. Критическая область соответствует значениям статистики, для которых значение велико. Это означает, что данные плохо согласуются.
№9 слайд
Содержание слайда: Что значит «частоты согласуются»
Если наблюдаемые и ожидаемые значения близки друг к другу, значение X будет небольшим. Гипотеза Н0 не будет отвергнута. Имеется хорошее соответствие наблюдаемых данных и исследовательской модели.
№10 слайд
Содержание слайда: Решение задачи
Шаг 1. Нулевая и альтернативная гипотезы:
Н0: У покупателей нет предпочтений по поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Шаг 2. Уровень значимости =0,05.
Шаг 3. Критическое значение равно 9,488 (по таблице 2-распределения или с помощью функции Excel,df = 5 – 1 = 4 и α = 0,05).
=ХИ2ОБР(0,05;4)
Шаг 4. По выборке находим значение статистики:
Шаг 5. Сравним полученное значение с критической областью: 18 > 9,488. Значение попало в критическую область.
Шаг 6. Формулируем ответ. Существуют значимые предпочтения покупателей по поводу вида напитка.
№11 слайд
Содержание слайда: Применение критерия согласия
1. Для проверки гипотезы о согласовании наблюдаемого распределения и теоретического. Это было в примере с напитками. Наиболее часто проверяют согласование наблюдаемого распределения с нормальным, т.к. многие критерии предполагают нормальность распределения.
2. Для проверки гипотезы о совпадении законов распределения двух генеральных совокупностей. Предположение о виде теоретического распределения (теоретическая модель данных) в этом случае не требуется. Критерий дает нам представление о «расстоянии между двумя наборами данных» и на основе значения этого расстояния позволяет делать вывод о «согласии» между двумя распределениями.
№12 слайд
Содержание слайда: 6.2
Таблицы сопряженности
№13 слайд
Содержание слайда: Обработка данных
Данные эксперимента Таблица сопряженности
№14 слайд
Содержание слайда: В общем виде таблица сопряженности состоит из r рядов
В общем виде таблица сопряженности состоит из r рядов
и c столбцов.
Каждая клетка таблицы определяется номером ее ряда (Row)
и столбца (Column).
№15 слайд
Содержание слайда: 6.3. Проверка независимости качественных признаков
№16 слайд
Содержание слайда: Наблюдаемые частоты (Observed frequencies)
В результате эксперимента мы получаем наблюдаемые частоты. Подсчитаем суммы по срокам и столбцам.
№17 слайд
Содержание слайда: Шаг 1. Гипотезы
Критерий согласия используется для проверки гипотезы о независимости качественных признаков.
Гипотезы выглядят так:
Н0 : признаки независимы.
Н1 : признаки зависимы.
№18 слайд
Содержание слайда: Ожидаемые частоты (Expected frequencies)
Вычислим теоретические ожидаемые частоты (в предположении независимости признаков).
А – случайно выбранный медработник – медсестра
B – случайно выбранный медработник согласен с эффективностью препарата
№19 слайд
Содержание слайда: А – случайно выбранный медработник – медсестра
B – случайно выбранный медработник согласен с эффективностью
препарата
№20 слайд
Содержание слайда: А – случайно выбранный медработник – медсестра
B – случайно выбранный медработник согласен с эффективностью
препарата
№21 слайд
Содержание слайда: Ожидаемые частоты (Expected frequencies)
Вычислим теоретические частоты (в предположении независимости признаков). В первую клетку надо поставить частоту:
№22 слайд
Содержание слайда: Ожидаемые частоты (Expected frequencies)
Вычислим теоретические частоты.
№23 слайд
Содержание слайда: Критерий проверки гипотезы
Если бы признаки были независимыми, то частоты должны быть распределены так, как показано в таблице ожидаемых частот. Критерий согласия позволяет оценить, насколько сильно различаются наблюдаемые частоты от ожидаемых. Если сильно, тогда мы признаем наличие зависимости признаков.
№24 слайд
Содержание слайда: Вычисление статистики
№25 слайд
Содержание слайда: Уровень значимости и критическая область
В условиях нулевой гипотезы статистика имеет 2-распределение с числом степеней свободы df = (r – 1)(c – 1) = (2 – 1)(3 – 1) = 2. Зададим α = 0,05, критическое значение равно 5,991.
№26 слайд
Содержание слайда: Получение выводов
Поскольку значение статистики попало в критическую область, 26,67 > 5,991, мы отклоняем гипотезу о независимости признаков.
Вывод. Признаки зависимы. Отношение к новому лекарству существенно зависит от категории персонала.