Оцените презентацию от 1 до 5 баллов!
Тип файла:
ppt / pptx (powerpoint)
Всего слайдов:
12 слайдов
Для класса:
1,2,3,4,5,6,7,8,9,10,11
Размер файла:
291.00 kB
Просмотров:
112
Скачиваний:
2
Автор:
неизвестен
Слайды и текст к этой презентации:
№1 слайд
Содержание слайда: Анализ тональности сообщений
Лидия Михайловна Пивоварова
Системы понимания текста
№2 слайд
Содержание слайда: Введение
Opinion Mining – извлечение мнений, а не фактов:
Поиск отзывов о товарах и услугах (как потребителями, так и производителями)
Анализ мнений для политологических, социологических и др. исследований
Другие приложения:
Рекомендательные системы
Извлечение информации
Вопросно-ответный поиск
№3 слайд
Содержание слайда: Общая схема
Объект O имеет (иерархический) набор свойств fi
Каждое свойство может выражаться набором слов/словосочетаний wi - синонимов
Субъект (opinion holder) высказывает свое мнение об O или о каких-то его свойствах
№4 слайд
Содержание слайда: Основные задачи
На уровне документа:
Классификация тональности
Классы: позитивный, негативный, нейтральный
Предполагается, что каждый документ содержит мнение только об одном объекте и только одного субьекта
На уровне предложения:
Идентификация предложений, содержащих мнения
Определение тональности предложения
Предполагается, что каждое предложение содержит только одно мнение
На уровне свойств:
Определение свойств, которые оценивает субъект
Сгруппировать синонимы (если они неизвестны)
Идентифицировать тональность оценки
№5 слайд
Содержание слайда: Классификация документов
Классификация – классическая задача машинного обучения
Различия с тематической классификацией только в используемых свойствах
Наличие терминов и их частота (часто взвешенная)
Части речи – для определения тональности принципиально важны прилагательные и наречия
Оценочные слова и словосочетания (словарь или более сложная структура типа WordNet)
Синтаксические зависимости – позволяют делать предположения о семантических отношениях между оценочными и тематическими словами
Отрицания – могут изменить мнение на противоположное
№6 слайд
Содержание слайда: Категоризация документов
Список оценочной лексики (прилагательные и наречия)
Для всех упоминаний объекта и/или его свойств рядом с оценочной лексикой, подсчитывается коэффициент взаимной информации:
Итоговая оценка для данного упоминания:
Оценка суммируется для документа в целом
№7 слайд
Содержание слайда: Уровень документа и предложения
Документ может быть очень противоречивым
Требуется переход на уровень предложений
Классификация предложений:
Объективные/субъективные
И затем негативные/позитивные
Но: позитивная оценка объекта не означает позитивной оценки всех его свойств (и vice versa)
Предложения могут быть очень сложными – нужно переходить на уровень отдельных свойств
№8 слайд
Содержание слайда: Оценка свойств
Идентификация свойств
Группировка синонимов
Определение оценок
Подходы очень похожи на Information Extraction:
(Named) Entity Recognition + установление фактов (оценок)
Словари, образцы, машинное обучение
№9 слайд
Содержание слайда: Сравнения
Два вида оценок:
X хороший (плохой, тяжелый, легкий, звонкий…)
X лучше (хуже, выше, ниже, толще, мощнее…) чем Y
Требуют более детальной обработки
Типы сравнений:
Градации
A лучше B
А такой же как B
A лучше всех
Сравнения по свойствам
У A есть характеристики, которых нет у B
У А одни свойства, у В другие
А похож на В не считая некоторых свойств
№10 слайд
Содержание слайда: Примеры сравнений
№11 слайд
Содержание слайда: Построение словарей
Вручную
На основе существующих словарей и тезаурусов (WordNet)
Автоматически
Bootstrapping
Она умная и красивая vs. Она умная, но вредная
Возможно построение доменно-ориентированных словарей
№12 слайд
Содержание слайда: Источники
Liu B. Sentiment Analysis and Subjectivity // Handbook of natural language processing, Second Edition Editor(s): Nitin Indurkhya; Fred J. Damerau, Goshen, Connecticut, USA – 2010 – pp. 627-666
Bing Liu Web Data Mining. Lecture Slides, Chapter 11 – http://www.cs.uic.edu/~liub/WebMiningBook.html
Bing Liu Opinion Mining and Summarization, tutorial - http://www.cs.uic.edu/~liub/FBS/opinion-mining-sentiment-analysis.pdf
Bo Pang and Lillian Lee Opinion mining and sentiment analysis // Foundations and Trends in Information Retrieval 2(1-2), pp. 1–135, 2008. – http://www.cs.cornell.edu/home/llee/opinion-mining-sentiment-analysis-survey.html