Оцените презентацию от 1 до 5 баллов!
Тип файла:
ppt / pptx (powerpoint)
Всего слайдов:
22 слайда
Для класса:
1,2,3,4,5,6,7,8,9,10,11
Размер файла:
309.50 kB
Просмотров:
64
Скачиваний:
0
Автор:
неизвестен
Слайды и текст к этой презентации:
№1 слайд![Поиск информации. Борисов](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img0.jpg)
Содержание слайда: Поиск информации.
Борисов В.А.
Красноармейский филиал
ГОУ ВПО «Академия народного хозяйства
при Правительстве РФ»
Красноармейск 2009 г.
№2 слайд![Поиск информации Задача,](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img1.jpg)
Содержание слайда: Поиск информации
Задача, которую человечество решает уже многие столетия.
№3 слайд![Все найденные за много лет](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img2.jpg)
Содержание слайда: Все найденные за много лет средства и приемы поиска информации доступны и эффективны и при поиске информации в Интернет.
№4 слайд![ПЕРТИНЕНТНЫЙ ДОКУМЕНТ Слово](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img3.jpg)
Содержание слайда: “ПЕРТИНЕНТНЫЙ ДОКУМЕНТ”
Слово “пертинентный” происходит от английского “pertinent”, что значит “относящийся к делу, подходящий по сути”.
№5 слайд![Цель информационного поиска](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img4.jpg)
Содержание слайда: Цель информационного поиска
Найти все пертинентные и только пертинентные документы (мы хотим найти “только то, что хотим, и ничего больше”).
Эта цель - идеальна и пока недостижима.
№6 слайд![Для того, чтобы было с чем](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img5.jpg)
Содержание слайда: Для того, чтобы было с чем сравнивать, необходимо некоторое количество непертинентных документов.
Эти документы называются - “ШУМ”.
№7 слайд![Когда документов много,](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img6.jpg)
Содержание слайда: Когда документов много, используется информационно-поисковая система (ИПС).
В этом случае информационная потребность должна быть выражена средствами, которые “понимает” ИПС - должен быть сформулирован ЗАПРОС.
№8 слайд![РЕЛЕВАНТНОСТЬ Степень](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img7.jpg)
Содержание слайда: РЕЛЕВАНТНОСТЬ
Степень соответствия документа запросу.
№9 слайд![Виды информационно поисковых](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img8.jpg)
Содержание слайда: Виды информационно поисковых систем
№10 слайд![Классификационные ИПС В](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img9.jpg)
Содержание слайда: Классификационные ИПС
В классификационных ИПС используется иерархическая (древовидная) организация информации, которая называется КЛАССИФИКАТОРОМ.
№11 слайд![Разделы классификатора](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img10.jpg)
Содержание слайда: Разделы классификатора называются РУБРИКАМИ.
Библиотечный аналог классификационной ИПС - систематический каталог.
№12 слайд![Предметная ИПС Web-кольца](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img11.jpg)
Содержание слайда: Предметная ИПС Web-кольца
Поиск названия нужного предмета своего интереса (предметом может быть и нечто невещественное, например, индийская музыка), а с названием связаны списки соответствующих ресурсов Интернет.
№13 слайд![Словарные ИПС Основная идея](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img12.jpg)
Содержание слайда: Словарные ИПС
Основная идея словарной ИПС - создать словарь из слов, встречающихся в документах Интернет, в котором при каждом слове будет храниться список документов, из которых взято данное слово.
№14 слайд![Два основных алгоритма работы](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img13.jpg)
Содержание слайда: Два основных алгоритма работы словарных ИПС:
-с использованием ключевых слов,
-с использованием дескрипторов.
№15 слайд![Использование ключевых слов](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img14.jpg)
Содержание слайда: Использование ключевых слов
Для оценки содержимого документа используются только те слова, которые в нем встречаются, и по запросу ИПС сопоставляет слова из запроса со словами документа, определяя по количеству, расположению, весу слов из запроса в документе его релевантность.
№16 слайд![Использование дескрипторов](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img15.jpg)
Содержание слайда: Использование дескрипторов
Индексируемые документы переводятся на некоторый дескрипторный информационный язык.
Дескрипторный информационный язык, как и любой другой язык, состоит из алфавита (символов), слов, средств выражения парадигматических и синтагматических отношений между словами.
№17 слайд![Ранжирование результатов](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img16.jpg)
Содержание слайда: Ранжирование результатов поиска
Все ИПС в настоящее время уделяют основное внимание именно алгоритму ранжирования полученных ссылок.
№18 слайд![Критерии при ранжировании в](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img17.jpg)
Содержание слайда: Критерии при ранжировании в ИПС
наличие слов из запроса в документе, их количество, близость к началу документа, близость друг к другу;
наличие слов из запроса в заголовках и подзаголовках документов;
количество ссылок на данный документ с других документов;
«респектабельность» ссылающихся документов.
№19 слайд![Современные проблемы](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img18.jpg)
Содержание слайда: Современные проблемы поисковых систем
Когда эти технологии разрабатывались никто из разработчиков не представлял себе, что Интернет станет глобальной информационной средой.
№20 слайд![Архитектура crawler сборщик -](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img19.jpg)
Содержание слайда: Архитектура
crawler (сборщик) - осуществляет сканирование Интернет ресурсов в поисках изменений на страницах;
indexer (индексатор) - индексирует ресурсы, строит базы данных по ключевым словам, хранит эти базы данных в виде, удобном для поиска по ним;
gateway (шлюз) - осуществляет прием запросов от пользователей и выдачу им информации из базы данных.
№21 слайд![Алгоритмы поиска и](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img20.jpg)
Содержание слайда: Алгоритмы поиска и ранжирования
Основной проблемой современных поисковых систем является то, что по причине фактически устаревшей архитектуры они не могут обеспечить качественный поиск информации.
№22 слайд![Основные моменты новой](/documents/fb7ae5c5fde1948ca5881eb030bd3f7c/img21.jpg)
Содержание слайда: Основные моменты новой архитектуры ИПС
Переход к распределенной модели вычислений;
Переход от модели «один поиск на всех» к модели персонального поиска;
Переход от критериев релевантности к критерию пертинентности;
Переход от поиска только текстовой информации к распознаванию и поиску мультимедийной информации.