Презентация ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ ТЕРМИНОЛОГИЧЕСКИХ ВАРИАНТОВ В ТЕКСТАХ Антонов Вадим Юрьевич Научный руководитель: Ефремова Нат онлайн

На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ ТЕРМИНОЛОГИЧЕСКИХ ВАРИАНТОВ В ТЕКСТАХ Антонов Вадим Юрьевич Научный руководитель: Ефремова Нат абсолютно бесплатно. Урок-презентация на эту тему содержит всего 14 слайдов. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.
Презентации » Новости » ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ ТЕРМИНОЛОГИЧЕСКИХ ВАРИАНТОВ В ТЕКСТАХ Антонов Вадим Юрьевич Научный руководитель: Ефремова Нат



Оцените!
Оцените презентацию от 1 до 5 баллов!
  • Тип файла:
    ppt / pptx (powerpoint)
  • Всего слайдов:
    14 слайдов
  • Для класса:
    1,2,3,4,5,6,7,8,9,10,11
  • Размер файла:
    547.00 kB
  • Просмотров:
    83
  • Скачиваний:
    1
  • Автор:
    неизвестен



Слайды и текст к этой презентации:

№1 слайд
ПРОГРАММНЫЕ СРЕДСТВА
Содержание слайда: ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ ТЕРМИНОЛОГИЧЕСКИХ ВАРИАНТОВ В ТЕКСТАХ Антонов Вадим Юрьевич Научный руководитель: Ефремова Наталья Эрнестовна

№2 слайд
ТЕРМИНЫ И ИХ ВАРИАНТЫ Термины
Содержание слайда: ТЕРМИНЫ И ИХ ВАРИАНТЫ Термины – слова и словосочетания, называющие понятия предметной области рентгеновское излучение Употребление терминов в текстах –> терминологические варианты излучение, рентгеновские лучи Выявление терминологических вариантов важно учитывать при построении тезаурусов, онтологий, предметных указателей, классификации текстов

№3 слайд
КЛАССИФИКАЦИЯ ВАРИАНТОВ
Содержание слайда: КЛАССИФИКАЦИЯ ВАРИАНТОВ

№4 слайд
ПОСТАНОВКА ЗАДАЧИ Изучить
Содержание слайда: ПОСТАНОВКА ЗАДАЧИ Изучить классификацию терминологических вариантов и подходы к их выявлению На базе классификации разработать методы выявления терминологических вариантов в научно-технических текстах на русском языке На их основе реализовать программные средства Провести тестирование разработанных методов

№5 слайд
ПОДХОДЫ К ВЫЯВЛЕНИЮ
Содержание слайда: ПОДХОДЫ К ВЫЯВЛЕНИЮ Символьный (статистический) подход Термин и его варианты – символы Вычисляется функция близости для термина и его варианта, для выбора порогового значения используется статистика Не требуется лингвистическая информация и словари Используется для орфографических и флективных вариантов Лингвистический подход Термин и его варианты – словосочетания Анализируется синтаксическая структура словосочетания, применяются правила образования вариантов и эвристики Используется для лексико-синтаксических вариантов Применён для английского и французского языков, для русского языка не изучен

№6 слайд
ПРЕДЛАГАЕМОЕ РЕШЕНИЕ Для
Содержание слайда: ПРЕДЛАГАЕМОЕ РЕШЕНИЕ Для каждого типа терминологических вариантов используется свой метод, основанный на одном из подходов

№7 слайд
ЛЕКСИКО-СИНТАКСИЧЕСКИЕ
Содержание слайда: ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ВАРИАНТЫ: ФОРМАЛИЗАЦИЯ Информация о лексико-синтаксических вариантах формализована в виде правил их образования Для формализации выбран язык LSPL и его библиотека: позволяет описывать конструкции естественного языка в виде лексико-синтаксических шаблонов предусмотрена возможность обработки информации, полученной в результате наложения LSPL-шаблона Правило образования – лексико-синтаксический шаблон вида: A1 N1 # N1, A2 N1, A1 N2

№8 слайд
ЛЕКСИКО-СИНТАКСИЧЕСКИЕ
Содержание слайда: ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ВАРИАНТЫ: ВЫЯВЛЕНИЕ Основано на автоматической конкретизации шаблона правила A1 N1 <A1=N1> # A1 N2 <Syn(N1,N2),A1=N2> рентгеновские лучи # рентгеновское излучение 1 . Распознавание термина заданной структуры A1 => рентгеновские, N1 => лучи 2. Нормализация слов термина рентгеновские => рентгеновский, лучи => луч 3. Построение шаблона возможного варианта A1<рентгеновский> N2 <Syn(“луч”,N2),A1=N2> 4. Поиск варианта в тексте по конкретизированному шаблону

№9 слайд
ОБЩАЯ ПРОЦЕДУРА ВЫЯВЛЕНИЯ
Содержание слайда: ОБЩАЯ ПРОЦЕДУРА ВЫЯВЛЕНИЯ Исходная информация: Список терминов L1 Список кандидатов в терминологические варианты L2 Алгоритм: 1. Для каждого Ti ϵ L1 рассматриваем все Vj ϵ L2 2. Для пары Ti и Vj проверяем, являются ли они вариантами, путём применения методов в определённом порядке Результаты работы: Для каждого термина из L1 – список терминологических вариантов из L2

№10 слайд
ПРОГРАММНЫЕ СРЕДСТВА
Содержание слайда: ПРОГРАММНЫЕ СРЕДСТВА: АРХИТЕКТУРА

№11 слайд
РЕАЛИЗАЦИЯ И ТЕСТИРОВАНИЕ
Содержание слайда: РЕАЛИЗАЦИЯ И ТЕСТИРОВАНИЕ МЕТОДОВ Для реализации использован язык С++ Библиотеки: LSPL, AOT, boost, STL Система контроля версий: git Тестирование на научно-технических текстах из областей физики и информатики объемом более 500кб Полнота выявления вариантов: 91% Точность выявления вариантов: 86% Выявлено употреблений терминов без учета терминологических вариантов: 13668 Выявлено употреблений терминов с учетом терминологических вариантов: 25178 Процент прироста употреблений терминов: 84%

№12 слайд
РЕЗУЛЬТАТЫ РАБОТЫ
Содержание слайда: РЕЗУЛЬТАТЫ РАБОТЫ Проанализированы современные подходы к выявлению терминологических вариантов, изучена классификация вариантов, типичных для русскоязычных научно-технических текстов Разработаны методы выявления терминологических вариантов в соответствии с классификацией Библиотека языка LSPL расширена для формирования конкретизированных шаблонов Методы выявления реализованы в виде программных средств Тестирование показало состоятельность предложенных методов выявления

№13 слайд
Результаты работы были
Содержание слайда: Результаты работы были представлены (с публикацией) на: Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов 2010» Международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2010» СПАСИБО ЗА ВНИМАНИЕ!

№14 слайд
Расстояние Левенштейна
Содержание слайда: Расстояние Левенштейна Минимальное количество операций вставки, удаления и замены, необходимых для перевода одной строки в другую

Скачать все slide презентации ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ ТЕРМИНОЛОГИЧЕСКИХ ВАРИАНТОВ В ТЕКСТАХ Антонов Вадим Юрьевич Научный руководитель: Ефремова Нат одним архивом:
Похожие презентации