Презентация Методы анализа данных. Основы математической статистики онлайн

На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему Методы анализа данных. Основы математической статистики абсолютно бесплатно. Урок-презентация на эту тему содержит всего 45 слайдов. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.
Презентации » Математика » Методы анализа данных. Основы математической статистики



Оцените!
Оцените презентацию от 1 до 5 баллов!
  • Тип файла:
    ppt / pptx (powerpoint)
  • Всего слайдов:
    45 слайдов
  • Для класса:
    1,2,3,4,5,6,7,8,9,10,11
  • Размер файла:
    1.85 MB
  • Просмотров:
    121
  • Скачиваний:
    1
  • Автор:
    неизвестен



Слайды и текст к этой презентации:

№1 слайд
Содержание слайда:

№2 слайд
Основные направления
Содержание слайда: Основные направления применения математико-статистических методов в медицине и здравоохранении: 1)Наиболее эффективный сбор данных и обобщение полученных результатов. 2)Сравнение и определение достоверности различия двух и более групп результатов. 3)Изучение взаимосвязи между факторами и явлениями; 4) Анализ динамики процессов. 5) Анализ прогностических факторов. 6) Анализ зависимостей между факторами. 7) Анализ выживаемости (анализ времени жизни в одной и более группах, сравнение групп по времени жизни, оценка влияния факторов на время жизни пациентов). 8) Вычисление необходимого объема выборки, анализ мощности критериев. 9) Прогнозирование исхода лечения.

№3 слайд
Содержание слайда:

№4 слайд
Содержание слайда:

№5 слайд
DATA MINING КЛАССЫ РЕШАЕМЫХ
Содержание слайда: DATA MINING – КЛАССЫ РЕШАЕМЫХ ЗАДАЧ Классификация Регрессия Кластеризация Ассоциация Последовательность

№6 слайд
ЭТАПЫ ОПЕРАЦИИ С
Содержание слайда: ЭТАПЫ ОПЕРАЦИИ С МЕДИКО-БИОЛОГИЧЕСКИМИ ДАННЫМИ 1. Сбор и первичная обработка данных – это накопление результатов исследований в том объеме, который задан условиями поставленной задачи или необходимостью принять адекватное решение. Исследователь располагает ограниченным числом наблюдений. 2. Оценка эффективности измерения данных – это определение степени точности и величины погрешности зарегистрированных сигналов и полученных данных. 3. Cохранение данных – это регистрация данных в виде твердых копий или на магнитных носителях. 4. Формализация и стандартизация данных – это сведение всех полученных данных к единой форме, которая должна соответствовать требованиям компьютерной обработки и обеспечивать сопоставимость всех данных между собою, а также доступность их для всех заинтересованных пользователей.

№7 слайд
ЭТАПЫ ОПЕРАЦИИ С
Содержание слайда: ЭТАПЫ ОПЕРАЦИИ С МЕДИКО-БИОЛОГИЧЕСКИМИ ДАННЫМИ 5. Фильтрация и очищение данных – это отсеивание лишних сигналов, обусловленных неточностью работы регистрирующих приборов, некорректно собранной информацией о состоянии изучаемого явления. 6. Кодировка данных – это унификация формы представления данных на бумажных или магнитных носителях. 7. Сортировка данных – это упорядочение данных по заданному признаку или совокупности их характеристик . 8. Преобразование данных – это изменение формы данных по заданному алгоритму или между различными типами носителей. 9. Сжатие и архивация данных – это уплотнение данных на носителях и организация их хранения, нередко связана с изменением их формы. 10. Защита данных – это приведение данных по специальному алгоритму к форме, которая недоступна для несанкционированного их использования (шифрование, или криптографическая обработка данных). 11. Транспортировка данных – это передача данных на расстояния с помощью механических или телекоммуникационных каналов связи.

№8 слайд
ЭТАПЫ ОПЕРАЦИИ С
Содержание слайда: ЭТАПЫ ОПЕРАЦИИ С МЕДИКО-БИОЛОГИЧЕСКИМИ ДАННЫМИ Высокая точность измерения достигается при минимальных рандомизированных и систематических погрешностях. Систематические погрешности - погрешности, соответствующие отклонению измеренного значения от истинного значения величины всегда в одну сторону (повышения или занижения). При повторных измерениях погрешность остается прежней. Систематические ошибки отражают неправильное выполнение исследований, ошибки в настройке аппаратуры, неправильную калибровку лабораторного оборудования (электронных приборов, весов, тонометров и др.), неадекватный подбор больных, нарушение технологии приготовления растворов в биохимических лабораториях, ошибки, допущенных в расчетах. Возможность их избежать –тщательно контролировать исправность медицинской аппаратуры, проводить регулярную поверку в специальных лабораториях, следить за правильностью выполнения диагностических и расчетных процедур, корректно выполнять эти расчеты.  

№9 слайд
ЭТАПЫ ОПЕРАЦИИ С
Содержание слайда: ЭТАПЫ ОПЕРАЦИИ С МЕДИКО-БИОЛОГИЧЕСКИМИ ДАННЫМИ Случайные погрешности - это погрешности, которые непредсказуемым образом меняют свое численное значение. Такие погрешности вызываются большим числом неконтролируемых причин, влияющих на процесс измерения (неровности на поверхности объекта, дуновение ветра, скачки напряжения и т.д.). Рандомизированные или случайные, ошибки могут быть связаны: с неправильными (или недостаточно точными) заключениями врача-специалиста, проводящего исследования. с ограниченной точностью инструментов, вариабельностью измеряемого объекта (колебания биологических параметров человека во время исследования (суточные биоритмы), наводка по электросетям во время снятия биопотенциалов (ЭКГ, электроэнцефалография)). Влияние случайных погрешностей может быть уменьшено при многократном повторении опыта.

№10 слайд
оценка качества измерений
Содержание слайда: оценка качества измерений Сходимость измерений - характеризует величину случайных ошибок. Критерий показывает, насколько близки друг к другу измерения, выполненные в одинаковых условиях, т.е. в одной и той же лаборатории и на одном и том же приборе. Воспроизводимость измерений - показывает, как близки между собою будут результаты измерений, выполненные в различных условиях, т.е. в различных лабораториях, на различных аппаратах и различными людьми. Величину расхождения между измерениями, выполненными в одних и тех же условиях, обозначают как среднее квадратическое, или стандартное, отклонение (σ).

№11 слайд
Основные понятия теории
Содержание слайда: Основные понятия теории вероятности Вероятность – количественная мера объективной возможности появления события при реализации определенного комплекса условий. Вероятность события А обозначается как р(А) и выражается в долях единицы или в процентах. Мера вероятности – диапазон ее числовых значений: от 0 до 1. Случайное событие – событие, которое при реализации определенного комплекса условий может произойти или не произойти. Достоверное событие - событие, которое при реализации определенного комплекса условий произойдет непременно. Невозможное событие - событие, которое при реализации определенного комплекса условий не произойдет никогда. Его вероятность будет равна 0.

№12 слайд
Основные понятия теории
Содержание слайда: Основные понятия теории вероятности Частота появления события (статистическая вероятность) – это отношение числа случаев, в которых реализовался определенный комплекс условий (m), к общему числу случаев (n): p(A)=m/n. Вероятность отсутствия события: q= 1- p. Случайная величина (СВ) – величина, которая при реализации определенного комплекса условий может принимать различные значения. По своей природе СВ бывают непрерывными и дискретными. Если СВ принимает конечное число значений, распределение задается функцией плотности вероятности Р(Х = х), ставящей каждому возможному значению х случайной величины Х вероятность того, что Х = х. Распределение может быть задано с помощью т.н. функции распределения F(x) = P(X<x), определяющей для всех действительных х вероятность того, что случайная величина Х принимает значения, меньшие х.

№13 слайд
Содержание слайда:

№14 слайд
Содержание слайда:

№15 слайд
Репрезентативность - это
Содержание слайда: Репрезентативность - это способность выборочной совокупности как количественно, так и качественно отражать свойства генеральной совокупности. Репрезентативность - это способность выборочной совокупности как количественно, так и качественно отражать свойства генеральной совокупности. Количественная репрезентативность достигается достаточностью числа наблюдений. Качественная - соответствием признаков единиц наблюдения в выборочной и генеральной совокупностях. Репрезентативная выборка повторяет пропорции генеральной совокупности, представляет собой меньшую по размерe модель генеральной совокупности за счет случайного отбора объектов.

№16 слайд
Содержание слайда:

№17 слайд
Любое значение параметра,
Содержание слайда: Любое значение параметра, вычисленное на основе ограниченного числа наблюдений, непременно содержит элемент случайности. Результат эксперимента - случайная величина. Любое значение параметра, вычисленное на основе ограниченного числа наблюдений, непременно содержит элемент случайности. Результат эксперимента - случайная величина. Такое приближенное, случайное значение называется оценкой параметра. Оценкой параметра называют функцию результатов наблюдений над случайной величиной (статистику), с помощью которой судят о значении параметра . ã(N) – статистическая оценка параметра а по данным N опытов (прогонов). Генеральная совокупность характеризуется одним или несколькими параметрами: µ, σ2, σ и т.д.

№18 слайд
Закон больших чисел При
Содержание слайда: Закон больших чисел При достаточно большом числе наблюдений случайные отклонения взаимно погашаются и проявляется устойчивость некоторых параметров, которая выражается в основной тенденции (закономерности). При большом числе случайных величин их средний результат перестает быть случайным и может быть предсказан с большой степенью определенности.

№19 слайд
Общие рекомендации по
Содержание слайда: Общие рекомендации по численности выборки: Общие рекомендации по численности выборки: Наибольший объем выборки необходим при разработке диагностической методики - от 200 до 1000-2500 человек. Если необходимо сравнивать 2 выборки, их общая численность должна быть не менее 50 человек; численность сравниваемых выборок должна быть приблизительно одинаковой. Если изучается взаимосвязь между какими-либо свойствами, то объем выборки должен быть не меньше 30-35 человек. Чем больше изменчивость изучаемого свойства, тем больше должен быть объем выборки. Поэтому изменчивость можно уменьшить, увеличивая однородность выборки, например, по полу, возрасту и т. д. При этом, естественно, уменьшаются возможности генерализации выводов.

№20 слайд
Клинические методы
Содержание слайда: Клинические методы исследования Методы клинического исследования - опрос пациента, лабораторное исследование , функциональная диагностика с использованием сложных систем типа МРТ, ПЭТ. Любое исследование начинается с постановки цели, статистической гипотезы, выбора подходящего дизайна исследования. К наиболее распространенным дизайнам клинических исследований относят:

№21 слайд
Дизайн клинических
Содержание слайда: Дизайн клинических исследований Исследование случай-контроль. Относится к ретроспективным исследованиям, т.е. таким, в которых ставится задача понять какие события в прошлом повлияли на состояние пациента в данный момент. При таком клиническом исследовании сравнивают людей, имеющих какое-то заболевание, с людьми, не страдающими им. Это делается для выявления зависимости между тем или иным клиническим исходом и воздействовавших ранее разнообразных факторов риска. Например, как курение повлияло на развитие раковой опухали. Когортное исследование. Относится к классу проспективных исследований, т.е. где изучается воздействие факторов риска до начала заболевания, а не после, как в ретроспективном. В этом исследовании формируются 2 группы. Одну группу подвергают воздействую вредных факторов, а вторую нет. А потом у этих групп сравнивают клинические исходы. Такой тип клинического исследования может быть очень длительным. Исследование перекрестного дизайна. При перекрестном исследовании набирается группа пациентов . Пациенты рандомизируются так, что одна группа получает лечебный препарат, а другая плацебо. Через какое-то время эти группы меняются местами так, что та, которая получала лечебный препарат стала получать плацебо, а та. что получала плацебо, стала получать лечебный препарат. Фиксируются различия. Рандомизированное контролируемое исследование. Используется для изучения взаимосвязей между лечением и исходом заболевания. При таком дизайне клинического исследования пациенты случайным образом разбиваются на группы. Ни исследователи, ни пациенты не знают какое лечение проводится в каждой из групп. После исследования или на какой-то фазе смотрят различия между группами.

№22 слайд
ОСНОВНЫЕ СТАТИСТИКИ
Содержание слайда: ОСНОВНЫЕ СТАТИСТИКИ Выборочное среднее x – оценка математического ожидания, среднее арифметическое элементов выборки. Выборочная дисперсия S2 – среднее квадратов отклонения элементов выборки от выборочного среднего, является оценкой дисперсии, характеризует разброс выборочных значений. Стандартное отклонение S – корень из дисперсии. Коэффициент вариации – отношение выборочного среднего квадратического отклонения к выборочной средней, характеризует рассеяние вне зависимости от размерности вариант . Размах варьирования- разность между наибольшей и наименьшей вариантами. Медиана Me. Мода Mo. Коэффициент эксцесса E. Коэффициент асимметрии A. Процентиль.

№23 слайд
ОСНОВНЫЕ СТАТИСТИКИ
Содержание слайда: ОСНОВНЫЕ СТАТИСТИКИ

№24 слайд
ОСНОВНЫЕ СТАТИСТИКИ .
Содержание слайда: ОСНОВНЫЕ СТАТИСТИКИ 4.

№25 слайд
Содержание слайда:

№26 слайд
ОСНОВНЫЕ СТАТИСТИКИ
Содержание слайда: ОСНОВНЫЕ СТАТИСТИКИ

№27 слайд
ОСНОВНЫЕ характеристики
Содержание слайда: ОСНОВНЫЕ характеристики вариационного ряда Медиана - это такое значение признака, которое делит упорядоченное (ранжированное) множество данных пополам так, что одна половина всех значений оказывается меньше медианы, а другая - больше. Если данные содержат нечетное число значений (8, 9, 10, 13, 15), то медиана есть центральное значение; Если данные содержат четное число значений (5, 8, 9, 11), то медиана есть точка, лежащая посередине между двумя центральными значениями. Мода - это такое значение из множества измерений, которое встречается наиболее часто. Когда два соседних значения встречаются одинаково часто и чаще, чем любое другое значение, мода есть среднее этих двух значений.

№28 слайд
ОСНОВНЫЕ СТАТИСТИКИ
Содержание слайда: ОСНОВНЫЕ СТАТИСТИКИ

№29 слайд
ОСНОВНЫЕ СТАТИСТИКИ Если
Содержание слайда: ОСНОВНЫЕ СТАТИСТИКИ Если значения переменной распределены несимметрично относительно центра, то группы лучше описывать с помощью медианы и квантилей (процентилей, квартилей, децилей). Квантилью xp (p-квантилью, квантилью уровня p) случайной величины, имеющей функцию распределения Fx (x), называют решение xp уравнения Fx (x) = p. Для некоторых p уравнение Fx (x) = p может иметь несколько решений, для некоторых - ни одного. Квантили, наиболее часто встречающиеся в практических задачах, имеют свои названия: медиана - квантиль уровня 0.5; нижняя квартиль - квантиль уровня 0.25; верхняя квартиль - квантиль уровня 0.75; децили - квантили уровней 0.1, 0.2, …, 0.9; процентили - квантили уровней 0.01, 0.02, …, 0.99.

№30 слайд
ОСНОВНЫЕ СТАТИСТИКИ
Содержание слайда: ОСНОВНЫЕ СТАТИСТИКИ Процентиль на уровне P - это такое значение, ниже которого расположено P процентов наблюдений данной переменной. Например, значение 50-й процентили указывает, что 50% значений располагается ниже этого уровня. Коэффициент эксцесса E - характеризует «островерхость» гистограммы или полигона по сравнению с кривой Гаусса нормального распределения. Коэффициент асимметрии A - характеризует степень симметричности гистограммы или полигона по сравнению с кривой Гаусса. Если коэффициенты асимметрии и эксцесса близки к нулю, то форму распределения можно считать близкой нормальному.

№31 слайд
ИНТЕРВАЛЬНЫЕ ОЦЕНКИ
Содержание слайда: ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ Интервальной оценкой параметра θ называется числовой интервал (a,b) который с заданной вероятностью p (надежностью) покрывает неизвестное значение параметра θ. Величина доверительного интервала зависит от объема выборки(уменьшается с ростом n) и надежности p (увеличивается с ростом p). Такой интервал (a,b) называется доверительным, а вероятность p доверительной вероятностью. Вместо нее часто задают величину α =1- p , называемую уровнем значимости.

№32 слайд
СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ
Содержание слайда: СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Статистическая гипотеза – некоторое предположение о свойствах генеральной совокупности, из которой взята выборка (о виде или параметрах неизвестного закона распределения). нулевая гипотеза H0 и альтернативная гипотезы H1. параметрическая (мат. ожидания, дисперсия, т.д.) и непараметрическая (подчинение СВ нормальному закону, закону Пуассона и т.д.) простая и сложная.

№33 слайд
Содержание слайда:

№34 слайд
ВЕРОЯТНОСТЬ ОШИБКИ В ВЫВОДАХ
Содержание слайда: ВЕРОЯТНОСТЬ ОШИБКИ В ВЫВОДАХ

№35 слайд
Статистика в медицине При
Содержание слайда: Статистика в медицине При проведении медицинского исследовании, как и при выполнении любого диагностического теста, могут встретиться следующие варианты врачебных заключений. 1. Интерпретация “положительный” у больных с наличием заболевания. Это истинно положительные случаи (TP, true positive). 2. Интерпретация “отрицательный” у пациентов без заболевания. Это – истинно отрицательные случаи (TN, true negative). 3. Интерпретация “положительный” у пациентов с отсутствием заболевания (у здоровых лиц). Это ложноположительные случаи (FP, false positive) ( “ложные тревоги”. В практической медицине риск совершить такого рода ошибки каждой врач устанавливает по-своему. Однако общепринятой критической величиной ложной тревоги является величина β риска, равная 0,05, или 5%. Этот уровень обозначается в медицинской статистике как уровень статистически значимого показателя. Он обозначается как p ≤ 0,05. Практически это означает, что врач ошибается в 1 случае из 20. 4. Интерпретация “отрицательный” у больных с заболеваниями. Это ложноотрицательные случаи . Как ложноположительные, так и ложноотрицательные ошибки представляют собою совокупность ошибок диагностики и выдвигают основное требование перед врачом-диагностом – их минимизации.

№36 слайд
Статистика в медицине Для
Содержание слайда: Статистика в медицине Для характеристики информативности диагностического метода исследования служат объективные параметры, именуемые операционными характеристиками теста. К операционным характеристикам метода диагностики относятся: – чувствительность (Se , sensitivity), – специфичность (Sp , specificity). Чувствительность (Se) – это пропорция правильных положительных результатов теста среди всех больных. Определяется по формуле: Se= TP∙100%/ D+ где Se – чувствительность; TP – верно положительные случаи; D+ – число больных искомым заболеванием.

№37 слайд
Статистика в медицине
Содержание слайда: Статистика в медицине Чувствительность априори показывает, какова будет доля больных, у которых данное исследование даст положительный результат. Чем выше чувствительность теста, тем чаще с его помощью будет выявляться заболевание, тем, следовательно, он более эффективен. Если высокочувствительный тест оказывается отрицательным, то наличие заболевания маловероятно. Поэтому их следует применять для исключения заболеваний. Тесты с высокой чувствительностью рекомендуется применять на ранних этапах диагностического процесса, когда требуется сузить круг предполагаемых заболеваний. Но высокочувствительный тест дает много “ложных тревог”, что требует дополнительных финансовых затрат на дальнейшее обследование.

№38 слайд
Статистика в медицине
Содержание слайда: Статистика в медицине Специфичность (Sp) – это пропорция правильных отрицательных результатов теста среди здоровых пациентов. Данный показатель определяется по формуле Sp= TN ∙100%/ D– где Sp – специфичность; TN – истинно отрицательные случаи; D– – здоровые пациенты. Определив специфичность, можно априори предполагать, какова доля здоровых лиц, у которых это исследование даст отрицательный результат. Чем выше специфичность метода, тем надежнее с его помощью подтверждается заболевание, тем, следовательно, он более эффективен. Тестирование эффективно на втором этапе диагностики, когда круг предполагаемых заболеваний сужен и необходимо с большой уверенностью доказать наличие болезни. Отрицательным фактором высокоспецифичного теста является тот факт, что его использование сопровождается весьма значительным числом пропусков заболевания.

№39 слайд
ВЕРОЯТНОСТЬ ОШИБКИ В ВЫВОДАХ
Содержание слайда: ВЕРОЯТНОСТЬ ОШИБКИ В ВЫВОДАХ Вероятность  допустить ошибку 1-го рода (отвергается верная), называется уровнем значимости критерия. :0,01; 0,05; 0,1 Вероятность не допустить ошибку 2-го рода (принимается ложная) (1-) называется мощностью критерия . Т.е. вероятность отвергнуть гипотезу, когда она неверна. Принятые в биомедицинской статистике жесткие рамки, определяющие долю ложноположительных результатов не более 5% - необходимость, так как на основании результатов медицинских исследований внедряется либо отклоняется новое лечение, а это вопрос жизни многих тысяч людей, мощностью критерия не менее 80%.

№40 слайд
ПРОВЕРКА СТАТИСТИЧЕСКОЙ
Содержание слайда: ПРОВЕРКА СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ Критериальная (тестовая) проверка - когда выборочная совокупность данных параметрически (своей функцией распределения) сравнивается с генеральной совокупностью или другой выборкой. Проверка гипотезы основывается на вычислении некоторой случайной величины – критерия, точное или приближенное распределение которого известно. Fнабл - выборочная характеристика (статистика) Fкр - критическое значение точного или приближенного распределения СВ

№41 слайд
ПРОВЕРКА СТАТИСТИЧЕСКОЙ
Содержание слайда: ПРОВЕРКА СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ Fнаб ≤ Fкр, гипотеза Но принимается. Принятие гипотезы Н0 следует расценивать как правдоподобное, не противоречащее опыту утверждение. Fнаб >Fкр, гипотеза Но отвергается.

№42 слайд
ПРОВЕРКА СТАТИСТИЧЕСКОЙ
Содержание слайда: ПРОВЕРКА СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ Задачи тестирования гипотез можно разделить на две группы: Первая группа отвечает на вопрос, имеются ли различия между группами по уровню некоторого показателя Например, различия в уровне печеночных трансаминаз у пациентов с гепатитом и здоровых людей. Вторая группа позволяет доказать наличие связи между двумя или более показателями, например, функции печени и иммунной системы. В практическом плане задачи из первой группы можно разделить на два подтипа: сравнение показателя только в двух группах(здоровые и больные, мужчины и женщины); сравнение трех и более групп (изучение разных доз препарата).

№43 слайд
ПРИМЕРЫ . Сравнение среднего
Содержание слайда: ПРИМЕРЫ 1. Сравнение среднего результата одной серии экспериментов со средним результатом другой серии. 2. Сравнение точности приборов, инструментов, методов измерений и т.д. 3. Сравнение долей признака в двух совокупностях

№44 слайд
СРАВНЕНИЕ -Х СРЕДНИХ Н M X M
Содержание слайда: СРАВНЕНИЕ 2-Х СРЕДНИХ Н0 : M(X) =M(Y) X и Y - нормальные генеральные совокупности - выборочные средние Если │Fнаб │< Fкр, Н0 принимается

№45 слайд
СПАСИБО ЗА ВНИМАНИЕ СПАСИБО
Содержание слайда: СПАСИБО ЗА ВНИМАНИЕ СПАСИБО ЗА ВНИМАНИЕ

Скачать все slide презентации Методы анализа данных. Основы математической статистики одним архивом:
Похожие презентации