Презентация AlephOne Positive – Negative Category Analysis онлайн

На нашем сайте вы можете скачать и просмотреть онлайн доклад-презентацию на тему AlephOne Positive – Negative Category Analysis абсолютно бесплатно. Урок-презентация на эту тему содержит всего 16 слайдов. Все материалы созданы в программе PowerPoint и имеют формат ppt или же pptx. Материалы и темы для презентаций взяты из открытых источников и загружены их авторами, за качество и достоверность информации в них администрация сайта не отвечает, все права принадлежат их создателям. Если вы нашли то, что искали, отблагодарите авторов - поделитесь ссылкой в социальных сетях, а наш сайт добавьте в закладки.
Презентации » Образование » AlephOne Positive – Negative Category Analysis



Оцените!
Оцените презентацию от 1 до 5 баллов!
  • Тип файла:
    ppt / pptx (powerpoint)
  • Всего слайдов:
    16 слайдов
  • Для класса:
    1,2,3,4,5,6,7,8,9,10,11
  • Размер файла:
    745.50 kB
  • Просмотров:
    46
  • Скачиваний:
    0
  • Автор:
    неизвестен



Слайды и текст к этой презентации:

№1 слайд
AlephOne Positive Negative
Содержание слайда: AlephOne Positive – Negative Category Analysis

№2 слайд
Задача. Основа работы системы
Содержание слайда: Задача. Основа работы системы это категоризация текстов на базе различных критериев. Базовый алгоритм предполагает произвольное количество категорий. Критерии и их веса определяются как нечеткие логические конструкции и выводы. При анализе текстов использовать не только «лингвистические» критерии, но и сопутствующую информацию Алгоритм предполагает обучение с минимальным участием человека

№3 слайд
Категории и начальные
Содержание слайда: Категории и начальные требования Адаптация алгоритма категоризации Алгоритм обучаемый с учителем 2 Категории: Positive Negative Тренировочный корпус текстов ~ 50% заведомо позитивных сообщений и 50% отрицательных: 100 сообщений с сайта Buy.com форум телефонов 100 сообщений с сайта Amazon форум бытовой техники Словарь термов должен выделяться автоматически

№4 слайд
Шаги обучения системы
Содержание слайда: Шаги обучения системы 1 Генерация словаря термов Генерация словаря на базе стандартных словарей английского языка Генерация словаря на базе Wiki Генерация словаря на основе базы сообщений из корпуса Генерация правил разбора сообщения Определение важнейших параметров сообщения для каждого форума: Частотные Текстовые Мета информационные

№5 слайд
Шаги обучения системы
Содержание слайда: Шаги обучения системы 2

№6 слайд
Шаги обучения системы
Содержание слайда: Шаги обучения системы 3 Составление функционала принадлежности к категории Нечеткие логические конструкции Весовые коэффициенты Подстановка корпуса положительных и отрицательных сообщений для определения весовых коэффициентов 100 сообщений с сайта Buy.com форум телефонов 100 сообщений с сайта Amazon форум бытовой техники и электроники

№7 слайд
BlackBerry Storm
Содержание слайда: BlackBerry Storm

№8 слайд
Android G
Содержание слайда: Android G1

№9 слайд
iPhone G
Содержание слайда: iPhone3G

№10 слайд
Результаты исследования
Содержание слайда: Результаты исследования 1 Словарь термов Сгенерированный словарь практически не повлиял на точность отнесения того или иного сообщения к категории, но повлиял на уверенность отнесения отдельного сообщения к категории (чем обширней словарь, тем хуже результат) Худший результат у формального словаря английского языка (результаты не валидны) Вывод: метод определения термов, использованный в нашей компании в целом оказался эффективен для английского языка

№11 слайд
Результаты исследования
Содержание слайда: Результаты исследования 2 Словарь Stopword отклонение составило не более 5-10% Google stopwords средний результат Wordnet stopwords худший результат Созданный нами лучший результат Вывод: вероятно сказалась привязка фильтра к «форумному сленгу». У Google средний результат говорит, что они вынуждено идут на компромиссы, т.к. имеют дело с текстами всех тематик одновременно. У Wordnet худший результат, т.к. они имеют дело с текстами больших объемов и достаточно чистыми.

№12 слайд
Результаты исследования
Содержание слайда: Результаты исследования 3 Тематика обучающего корпуса текстов практически не имеет значения. Ее можно определить как техническая. Машины, Телефоны Бытовая техника Электроника Необходимо соблюдать баланс между положительными и отрицательными сообщениями (не более 20%) Вывод: Точность определения составила 75%±10% вне зависимости от обучающей выборки.

№13 слайд
Результаты исследования
Содержание слайда: Результаты исследования 4 Наибольшую сложность представляла величина уверенности отнесения сообщения негативным или позитивным текстам. Увеличение Длины сообщения только ухудшало ситуацию. Есть некоторые темы, для которых не существует позитивных сообщений. К ним относятся: Политика Бюрократические процедуры Алгоритм оказался достаточно устойчив к сообщениям с условиями (например: «вроде бы не плох») В целом использование методов категоризации текстов применительно к эмоциональным категориям применимо, но осложняется, требованием единственности эмоции на текст.

№14 слайд
Вывод Использование методов
Содержание слайда: Вывод Использование методов категоризации текстов, применительно к эмоциональным категориям работает, но осложняется, требованием единственности эмоции на текст.

№15 слайд
Текущее состояние В настоящее
Содержание слайда: Текущее состояние В настоящее время исследования приостановлены и разработка продукта заморожена, в связи с отсутствием коммерческого спроса

№16 слайд
Конец Автоматизированные
Содержание слайда: Конец Автоматизированные методы определения эмоций и отношения потребителя к продукту. Рубен Гиргидов ruben@betria.com

Скачать все slide презентации AlephOne Positive – Negative Category Analysis одним архивом: