Оцените презентацию от 1 до 5 баллов!
Тип файла:
ppt / pptx (powerpoint)
Всего слайдов:
26 слайдов
Для класса:
1,2,3,4,5,6,7,8,9,10,11
Размер файла:
5.73 MB
Просмотров:
155
Скачиваний:
1
Автор:
неизвестен
Слайды и текст к этой презентации:
№1 слайд
Содержание слайда: Автоматизированная информационно-аналитическая платформа мониторинга сообщений СМИ, социальных сетей и блогосферы
№2 слайд
№3 слайд
Содержание слайда: Internet Archive – более 150 млрд. страниц за период c 1996 года по настоящий момент, включая тексты, графику, звук, видео и программы
Internet Archive – более 150 млрд. страниц за период c 1996 года по настоящий момент, включая тексты, графику, звук, видео и программы
The Planetary Data System – открытые результаты космических исследований
AOL – компания-владелец социальной сети Bebo, интернет-пейджера AIM, каталога ссылок всемирной паутины – Open Directory Project
Yellow Pages («Желтые страницы») – каталог контактной информации по организациям в более чем 75 странах
№4 слайд
Содержание слайда: АРИОН: Схема обработки
№5 слайд
№6 слайд
Содержание слайда: АРИОН: Разбор и очистка
Определение форматов файлов (doc, pdf, htm и т.д.)
Выделение информационной составляющей
Атрибуты файлов
Источники
Заголовки
Информационные поля
Очистка данных
Регулярные выражения
Универсальные обработчики гипертекстовых форматов
Структурный и лингвистический анализ
Шаблоны обработки страниц
№7 слайд
№8 слайд
Содержание слайда: АРИОН: Определение набора языков, использованных в документе
Дополнение атрибутов документа языковыми характеристиками
Полнотекстовое индексирование с учетом морфологических особенностей определяемых языков
(Чешский, Датский, Немецкий, Греческий, Английский, Испанский, Финский, Французский, Венгерский, Итальянский, Голландский, Норвежский, Португальский, Румынский, Русский, Тайский и др.)
№9 слайд
Содержание слайда: АРИОН: Формирование и хранение унифицированных представлений
№10 слайд
№11 слайд
Содержание слайда: АРИОН: Полнотекстовый поиск
Разные виды поиска – упрощённый и расширенный
Морфологический анализ запроса
Подсказка при формировании поискового запроса
Словари синонимов и стоп-слов
Развитый язык поисковых запросов: AND, OR, NOT, расстояние между словами, модификаторы * и ?, условия на конкретные поля, группировка условий при помощи ()
№12 слайд
Содержание слайда: Нельзя искать по контексту (известным объектам, фактам, тематикам и т.п.), только по ключевым словам
Нельзя искать по контексту (известным объектам, фактам, тематикам и т.п.), только по ключевым словам
Можно осуществлять переходы на другие страницы только по ссылкам автора информации
Существуют технологии, позволяющие искусственно поднимать в поисковой выдаче рекламные результаты (спам)
Найденные документы плохо структурированы и их необходимо читать / изучать для получения нужных сведений
№13 слайд
№14 слайд
№15 слайд
№16 слайд
№17 слайд
Содержание слайда: АРИОН: Извлечение семантического описания из источников данных
№18 слайд
Содержание слайда: Пример: откуда можно извлекать семантическое описание?
№19 слайд
Содержание слайда: DBpedia: все французские ученые, которые родились в 19 веке
№20 слайд
Содержание слайда: АРИОН: Автоматическое формирование семантического описания
Многозначная тематическая классификация текстов - отнесение документов к набору заранее заданных тем
Структурный анализ текстов – извлечение информации о персонах, организациях, географических объектах и др. именованных сущностях
№21 слайд
№22 слайд
№23 слайд
Содержание слайда: АРИОН: Работа с результатами поиска
Семантическая навигация
Выявление статистических закономерностей
Формирование типовых отчетов
№24 слайд
№25 слайд
№26 слайд