Презентация Суффиксные деревья (СД) онлайн
На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему Суффиксные деревья (СД) абсолютно бесплатно. Урок-презентация на эту тему содержит всего 43 слайда. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.
Презентации » Устройства и комплектующие » Суффиксные деревья (СД)
Оцените!
Оцените презентацию от 1 до 5 баллов!
- Тип файла:ppt / pptx (powerpoint)
- Всего слайдов:43 слайда
- Для класса:1,2,3,4,5,6,7,8,9,10,11
- Размер файла:1.22 MB
- Просмотров:81
- Скачиваний:1
- Автор:неизвестен
Слайды и текст к этой презентации:
№2 слайд
![Определение СД Суффиксное](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img1.jpg)
Содержание слайда: Определение СД
Суффиксное дерево Т для произвольной строки из m смволов – это ориентированное дерево с корнем, имеющим ровно m листьев, пронумерованных от 1 до m. Каждая внутренняя вершина, отличная от корня, имеет не менее 2 детей, и каждая дуга помечена непустой подстрокой строки S(дуговой меткой). Никакие 2 дуги, выходящие из одной вершины, не могут иметь пометки, начинающиеся с одного и того же символа.
№7 слайд
![Использование СД для задачи о](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img6.jpg)
Содержание слайда: Использование СД для задачи о точных совпадениях
Заданы образец Р длины n, и текст Т длины m.Найти все вхождения Р в Т за время O(n+m).
Строим СД для текста Т за время O(m). Ищем путь совпадения для Р.
Если такого пути нет, нет вхождения.
Если есть, каждый лист в поддереве, корнем которого является вершина окончания поиска, задает номер начальной позиции положения Р в Т.
№9 слайд
![Наивный алгоритм построения](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img8.jpg)
Содержание слайда: Наивный алгоритм построения суффиксного дерева
В дерево включаем простую дугу S$( суффикс S[1..m] $).
Последовательно включаются суффиксы S[i..m] $ для i от 2 до m.
Обозначим через N[i] промежуточное дерево, в которое входят суффиксы от 1 до i.
Дерево N[i+1] строится из дерева N[i]
Начинаем с корня N[i]
Находим самый длинный путь, метка которого совпадает с префиксом S[i+1 .. m] $. Остановка произойдет либо в вершине дерева, либо в средине какой-нибудь дуги. Если в средине дуги- она разбивается на 2 и вводится новая вершина.
И т. д.
Временная сложность О(m*m ).
№14 слайд
![Правила продолжения суффиксов](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img13.jpg)
Содержание слайда: Правила продолжения суффиксов
Правило 1. В текущем дереве путь β заканчивается в листе. При изменении дерева надо добавить к концу метки этой листовой дуги S[i+1].
Правило 2. Ни один путь из конца строки β не начинается символом S[i+1], но по крайней мере 1 путь оттуда существует.
Правило 3. Некоторый путь из конца строки β начинается символом S[i+1], тогда строка βS[i+1]уже существует в текущем дереве. Ничего не делать.
№18 слайд
![Суффиксные связи Первое](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img17.jpg)
Содержание слайда: Суффиксные связи
Первое ускорение реализации
Определение. Пусть ха –произвольная строка. Х-первый символ, а - оставшаяся подстрока(м.б. пустой). Если для внутренней вершины v с путевой меткой ха существует другая вершина s(v) c путевой меткой а, то указатель из v в s(v) называется суффиксной связью.
Иногда суффиксная связь из v в s(v) обозначается парой (v,s(v)).
№20 слайд
![Следствия Следствие . В](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img19.jpg)
Содержание слайда: Следствия
Следствие 1. В алгоритме Укконена любая вновь созданная внутренняя вершина будет иметь суффиксную связь с концом следующего предложения.
Следствие 2. В любом неявном суффиксно дереве T[i] , если внутренняя вершина v имеет путевую метку xa, то найдется вершина s(v) дерева T[i] с путевой меткой а
№22 слайд
![Переходы по суффиксным связям](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img21.jpg)
Содержание слайда: Переходы по суффиксным связям при построении Т[i+1](прод1)
Первое продолжение(j=1) фазы i+1
Конец полной строки S[1..i] в листе. Продолжение – просто.
Пусть S[1..i] имеет вид ха, где х -один символ, а - строка, возможно пустая. Пусть (v,1)-дуга, входящая в лист 1. Следующее действие алгоритма – нахождение конца строки S[2..i] =ав текущем дереве.
№23 слайд
![Переходы по суффиксным связям](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img22.jpg)
Содержание слайда: Переходы по суффиксным связям при построении Т[i+1](прод2)
Второе продолжение. Пусть ϒ- дуговая метка дуги (v,1). Для нахождения конца а, надо пройти вверх от листа 1 до v, затем по суффиксной связи из v в s(v), затем от s(v) вниз по пути с меткой ϒ. Конец пути – конец а.
№25 слайд
![Переходы по суффиксным связям](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img24.jpg)
Содержание слайда: Переходы по суффиксным связям при построении Т[i+1]
Различия между первыми двумя продолжениями и продолжением при j>2.
В общем случае конец S[j-1..i] мб в вершине, из которой выходит уже суффиксная связь. Алгоритм проходит эту суффиксную связь.
Теоретически доказано, что в продолжении j алгоритм никогда не поднимается выше, чем на одну дугу.
№29 слайд
![Прием скачок по счетчику На](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img28.jpg)
Содержание слайда: Прием №1 – скачок по счетчику
На шаге 2 продолжения j+1 алгоритм идет вниз из вершины s(v) по пути с меткой ϒ. При буквальной реализации прохождение по ϒ имеет сложность, пропорциональную ее длине. При использовании скачка по счетчику временная сложность уменьшается до числа вершин пути.
Временная сложность не превзойдет О(m).
№30 слайд
![Прием Пусть g длина . Пусть g](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img29.jpg)
Содержание слайда: Прием №1
Пусть g –длина ϒ. Пусть g1 – число символов в дуге перехода. Если g1<g, не надо просматривать остальные символы дуги. Просто осуществляется переход к ее концу.
Затем g=g-g1. h=g1+1. Просматриваются выходящие дуги для нахождения правильного продолжения( нач. символ = символу h строки ϒ. Этот шаг повторяется .
При достижении дуги с g<g1, выполняется переход к символу g дуги и завершается, т.к. путь ϒ из s(v)завершился на этой дуге.
№33 слайд
![Лемма о суффиксной связи](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img32.jpg)
Содержание слайда: Лемма о суффиксной связи
Определение. Вершинная глубина вершины – число вершин на пути от нее до корня.
Лемма 2.Пусть (v,s(v)) – суффиксная связь, проходимая в алгоритме Укконена. В этот момент вершинная глубина v не более чем на единицу превосходит вершинную глубину s(v)).
№38 слайд
![Дополнительные приемы](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img37.jpg)
Содержание слайда: Дополнительные приемы реализации
Замечание 1. В любой фазе- если правило продолжения 3 применяется в продолжении j, оно будет применяться во всех следующих продолжениях (от j+1 до i+1) до конца фазы.
Прием 2. Заканчивать каждую i+1 после первого использования продолжения 3. Если это произошло в продолжении j, нет необходимости нахождения концов строк S[k..i] с k>j.
№39 слайд
![Дополнительные приемы](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img38.jpg)
Содержание слайда: Дополнительные приемы реализации
Замечание 2. Стал листом, листом и останешься.
Прием 3. В фазе i+1, когда создается листовая дуга, помечаемая подстрокой S[p..i+1], вместо записи индексов дуги (р,i+1) использовать запись (р,е), где е – глобальный индекс(в начале фазы присваивается значение i+1.
№40 слайд
![Дополнение При использовании](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img39.jpg)
Содержание слайда: Дополнение
При использовании приемов 2 и 3 явные продолжения в фазе i+1( применяющие алгоритм SEA) требуются только от продолжения ji +1 до первого продолжения, использующего правило 3( или до продолжения i+1). Все другие продолжения выполняются неявно.
Т.е. фаза i+1 реализуется:
№43 слайд
![Создание настоящего](/documents_6/bfbdd26f7e7c4ac80647fa28623ff00a/img42.jpg)
Содержание слайда: Создание настоящего суффиксного дерева
Теорема 3. Алгоритм Укконена строит настоящее суффиксное дерево для S и все его суффиксные связи за время O(m).
Окончательное неявное дерево Tm можно преобразовать в истинное суффиксное дерево за время O(m).
Для этого к S добавляется терминальный символ $ и выполняется шаг алгоритма Укконена с этим символом.
Скачать все slide презентации Суффиксные деревья (СД) одним архивом: