Оцените презентацию от 1 до 5 баллов!
Тип файла:
ppt / pptx (powerpoint)
Всего слайдов:
17 слайдов
Для класса:
1,2,3,4,5,6,7,8,9,10,11
Размер файла:
442.50 kB
Просмотров:
83
Скачиваний:
0
Автор:
неизвестен
Слайды и текст к этой презентации:
№1 слайд
Содержание слайда: Лекция 9
Проверка статистических гипотез
Критерии согласия. Критерий χ2 (Пирсона). Критерий Колмогорова. Критерий nω2.
Критерии случайности. Критерий серий
(Ахметов С.К.)
№2 слайд
Содержание слайда: Критерий согласия
Критерии согласия – это статистики, которые позволяют проверить соответствие эмпирической и аналитической кривых распределения
Последовательность проверки:
- выдвигаются нулевая и альтернативная гипотезы
- назначается уровень значимости
- вычисляется эмпирическое значение тестовой статистики
- по результатам расчетов принимается решение
В качестве нулевой гипотезы принимается гипотеза о соответствие (согласии) аналитической и эмпирической функций распределения
Степень согласия оценивается с помощью специальных статистик
В гидрологической практике наиболее часто применяются критерий χ2 (Пирсона), критерий Колмогорова и критерий nω2 (Крамера – Мизеса – Смирнова).
№3 слайд
Содержание слайда: Критерий χ2 (Пирсона)
Критерий χ2 был предложен в начале XX Карлом Пирсоном и в настоящее время является наиболее распространенным критерием согласия
Последовательность применения:
Область допустимых значений (ОДЗ) исследуемой СВ Х разбивается на k интервалов. Число интервалов можно рассчитать по формуле k ≈ 5lg (n)
Интервалы по оси Х не будут равновеликими, но зато вероятность попадания значения СВ Х в любой интервал будет одинаковой p = 1/k
Теоретическое число случаев попадания значения СВ Х в каждый интервал будет равно m = n/k (n – длина выборки)
Расхождение между эмпирическими данными и аналитической функцией распределения определяется по тестовой статистике
№4 слайд
Содержание слайда: Критерий χ2 (Пирсона) - продолжение
Закон распределения данной статистики не зависит от вида исходного распределения и при достаточно большом n хорошо аппроксимируется распределением χ2 – квадрат с числом степеней свободы (v = k – r – 1);
где r – число параметров исходного распределения, определяемых по эмпирическим данным
Учитывая, что p*= m*/n можно записать, что
№5 слайд
Содержание слайда: Критерий χ2 (Пирсона) - продолжение
№6 слайд
Содержание слайда: Критерий Колмогорова
Мерой отличия эмпирической кривой распределения от теоретической является абсолютное по величине расхождение между эмпирической Р*(х) и аналитической Р(х) функциями обеспеченностей
∆ = max [Р*(х) - Р(х)]
Последовательность вычисления
1. Для каждого значения СВ Х вычисляются Р*(х), Р(х) и их разности
2. Выбирается наибольшее по модулю разность ∆
3. Рассчитывается статистика λ* = ∆√n, где n – объем выборки.
4. Функция обеспеченностей статистики λ при достаточно больших значениях n (n>40) может аппроксимирована выражением
№7 слайд
Содержание слайда: Критерий Колмогорова
Недостатки методики:
Учитывается только максимальное расхождение между эмпирической и аналитической функциями распределения
Наибольшая разность ∆ обычно отмечается в средней части кривой распределения, в то время как в гидрологической практике чаще всего важно знать ее крайние левые и правые части
Критерий не учитывает числа параметров, входящих в теоретическую функцию распределения
№8 слайд
Содержание слайда: Критерий nω2 (Крамера – Мизеса – Смирнова)
Тестовой статистикой данного критерия является средний квадрат отклонений между аналитической Р(х) и эмпирической Р*(х) функциями обеспеченностей по всем значениям случайной величины Х
№9 слайд
Содержание слайда: Критерий nω2 (Крамера – Мизеса – Смирнова) - 2
№10 слайд
Содержание слайда: Критерии случайности
Проверка гидрологических рядов на случайность проводится в рамках общей схемы статистической проверки гипотез. В качестве нулевой гипотезы принимается гипотеза о том, что имеющаяся выборка представляет собой последовательность независимых значений СВ
Применение критериев случайности основано на сопоставлении конкретных статистик эмпирического ряда с соответствующими теоретическими статистиками случайных совокупностей
№11 слайд
Содержание слайда: Критерий серий
Серия – это всякий участок последовательности, состоящий из элементов одного и того же ряда
Длина серии – число элементов, входящих в серию
К серии из элементов а относятся члены последовательности, значения которых превышают выборочное среднее (или медианное) значение
К серии из элементов в относятся члены последовательности, значения которых меньше выборочного среднего (или медианного) значения
№12 слайд
Содержание слайда: Критерий общего числа серий
Для проверки гипотезы о том, что данная совокупность сформирована из независимых значений СВ, используется статистика R, представляющая собой сумму серий из элементов a, ra и в rв (длина серий i при этом значения не имеет). Пример расчета ra и rв ясен из рисунка на след. слайде
Для случайных совокупностей статистика R = ra + rв имеет нормальное распределение с параметрами
№13 слайд
Содержание слайда: Пример расчета методом серий
№14 слайд
Содержание слайда: Критерий наибольшей длины серий
Этот критерий использует в качестве тестовой статистики наибольшую длину серии из элементов a и в: K = imax.
Теоретически доказано, что для СВ значение K выражается формулой
№15 слайд
Содержание слайда: Критерий числа повышений и понижений
Пусть имеется выборка СВ Х: х1, х2, х3 ….хn.
Переход от xi-1 к xi, называется повышением и обозначается «+», если xi-1 < xi,
Переход от xi-1 к xi, называется понижением и обозначается « - «, если xi-1 > xi,
Для случайных последовательностей число повышений и понижений распределяется асимптотически нормально с параметрами
№16 слайд
Содержание слайда: Критерий числа экстремумов
Экстремум – это элемент последовательности х1, х2, х3 ….хn для которого выполняется одно из неравенств
№17 слайд
Содержание слайда: СПАСИБО ЗА ВНИМАНИЕ!