Презентация Индуктивное моделирование: содержание и примеры применения в задачах обработки текстов М. Александров Академия народного хозяйст онлайн
На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему Индуктивное моделирование: содержание и примеры применения в задачах обработки текстов М. Александров Академия народного хозяйст абсолютно бесплатно. Урок-презентация на эту тему содержит всего 92 слайда. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.
Презентации » Образование » Индуктивное моделирование: содержание и примеры применения в задачах обработки текстов М. Александров Академия народного хозяйст
Оцените!
Оцените презентацию от 1 до 5 баллов!
- Тип файла:ppt / pptx (powerpoint)
- Всего слайдов:92 слайда
- Для класса:1,2,3,4,5,6,7,8,9,10,11
- Размер файла:1.12 MB
- Просмотров:147
- Скачиваний:0
- Автор:неизвестен
Слайды и текст к этой презентации:
№5 слайд
Содержание слайда: Введение
В чем индуктивность?
Индукция = из частных случаев делают обобщенный вывод
Дедукция = из общего результата делают выводы о частных случаях
Пример индуктивного вывода – метод математической индукции
Индуктивность в нашем случае состоит в том, что мы рассматриваем
конкретные частные модели, шаг за шагом усложняя их:
прямая, парабола, полином 3-го порядка, 4-го порядка, и т.д.
Но мы не рассматриваем одновременно все модели
(степенные и тригоном. полиномы, ряды экспонет, и т.п.)
или даже какой-то конкретный класс в целом
№6 слайд
Содержание слайда: Введение
В чем самоорганизация?
Саморганизация системы – это изменение ее структуры/параметров
под влиянием внешних условий
Самоорганизация у нас состоит в том, что модель меняется
от простой к сложной в процессе автоматического перебора моделей,
пока она не достигнет оптимальной сложности
Внешние условия – это данные наблюдений. Они отражают:
как поведение объекта, так и шум
Тогда очевидно, что:
- Простая модель не реагирует на шум, но плохо отражает объект
- Сложная модель отражает объект, но чувствительна к шуму
Есть некоторый оптимум, который достигается в процессе перебора
Термин используется условно – у нас иллюзия самоорганизации. Ведь
это мы меняем модель, а не она сама себя
№34 слайд
Содержание слайда: Эмпирические формулы
Требования
Построенная формула должна отражать два обстоятельства:
Поддержать факт, что небольшое относительное число
несовпавших букв n/s есть индикатор подобия слов
translation translated
Провести дискриминацию длинных слов. А именно:
чем слова длинее, тем менее вероятно, что они подобны
при том же отношении n/s ratio.
Лингвисты полностью поддержали эти два требования
№36 слайд
Содержание слайда: Эмпирические формулы
Число степеней свободы
Как было указано выше, формула должна зависеть от:
- относительной доли числа несовпавших букв, то есть n/s
- длины слов, то есть s или y
Это определяет необходимость иметь 2 степени свободы
Рассмотрим:
n/s < C 1 степень свободы n/s
n/s < F (s) 2 степени свободы n/s и s
n/s < F(y) 2 степени свободы n/s и y
n/s < F (y/s) 1 степень свободы, n/s
etc.
Коментарий: y = (s-n)/2, тогда y/s = (s-n)/2s = 0.5 (1- n/s)
Поэтому: n/s < F (y/s) имеет 1 степень свободы
№39 слайд
Содержание слайда: Подход
1) Мы рассматриваем
экстремальные случаи (равенство)
n/s = a0 + a1y + a2y2 + ...
2) Эксперт готовит «вручную»
пары подобных слов
Примеры
asking asked
translation translated
Перед началом эксперимента весь набор
исходных данных (пары подобных слов)
делится на обучающую и контрольную выборки
№43 слайд
Содержание слайда: Демонстрация
Пример
Начальный список 1-й шаг 2-й шаг 3-й шаг
transform (7) transform (12) transform (19) transform (19)
transformed(5) transformation(7) translating (6) translat (13)
transformation(7) translating (6) translator (7) transport (11)
translating (6) translator (7) transport (11) transported (2)
translator (7) transport (11) transported (2)
transport (11) transported (2)
transported (2)
Здесь:
Скобки содержат число появлений слов в тексте.
Значения сумируются, когда слова рассматриваются, как подобные
№44 слайд
Содержание слайда: Дискуссия и выводы
Примеры Мартина Портера
Д-р Портер, автор знаменитого стеммера, реализованного
на многих европейских языках, прислал письмо с примерами
1a. bead, bear, beat (короткий текст)
1b. cat, cats (короткий текст)
2a. bead, ..., beagle, beagling, ..., bear,...,
beast, beastliness, ..., beat (длинный текст)
2b. cat, catalogue, cataplasm, catastrophe,
catenary, cats (длинный текст)
Примеры показывают влияние длины текста на работу стеммера:
- на коротких текстах различные по смыслу слова
могут оказаться рядом и быть принятыми за сходные (см. 1a)
- на длинных текстах сходные по смыслу слова могут не
оказаться рядом, и сходство не будет обнаружено (см. 2b)
№45 слайд
Содержание слайда: Дискуссия и выводы
Недостатки стеммера
- Относительно низкая точность (80%-90%)
- Зависимость результатов применения от длины текста
Преимущества стеммера
- Языково независим – легко настраивается на язык и тему
- Простая настройка на заданный уровень ошибок 1 и 2 рода
Замечания
а) зависимость результатов от длины текста легко устраняется,
если проверка сходства выполняется по всему списку, а не только
для рядом стоящих слов
б) ошибки 1-го рода (пропуск сходных по смыслу слов) легко
обнаруживаются и исправляются при ручном контроле результата
Скачать все slide презентации Индуктивное моделирование: содержание и примеры применения в задачах обработки текстов М. Александров Академия народного хозяйст одним архивом:
-
Replacements, Ltd: заменять незаменимое Российская академия народного хозяйства и государственной службы при Президенте РФ
-
Российская Академия Народного Хозяйства и Государственной Службы При Президенте Российской Федерации Разработка Стратегическо
-
Балансировка загрузки процессоров Институт математического моделирования Российской академии наук
-
Дисциплинарное производство и внутреннее разрешение споров в спорте Александр Данилевич к. ю. н. , доцент кафедры международного ча
-
Минеральные ресурсы НЕФТЬ Содержание: Определение, применение; Ресурсообеспеченность; Страны-лидеры; Основные грузопотоки не
-
Толерантность – профессионально необходимая компетентность педагога, диктуемая задачами, содержанием и характером его деятельн
-
Лекция 12. Моделирование рынка: оценивание функций Торнквиста Содержание лекции: Подходы к моделированию рынка Зависимость спрос
-
Алгоритм выполнения задания А27 (Информационная обработка письменных текстов различных стилей и жанров)
-
Древние образы в народном искусстве Урок изобразительного искусства 5 класс I четверть Леденёва Наталья Александровна учител
-
Фундаментальное ядро предметной линии «Математика». Анализ примерной учебной программы для выделения содержания основных групп