Компьютеры научились анализировать отзывы в интернете
На конференции "Диалог" были представлены итоги сравнительного тестирования программ, которые распознают эмоции в тексте. Они свидетельствуют о том, что компьютеры практически догнали людей и научились определять хороший или плохой отзыв оставил человек о чем-то в интернете.
"В связи с напряженной обстановкой в России и в мире сейчас выделяются большие суммы на анализ блогов, прессы, региональной прессы, всяких сайтов", - сообщила Наталья Лукашевич из Научно-исследовательского вычислительного центра МГУ, которая обнародовала результаты тестирования. Она считает, что госзаказчики могут заинтересоваться работой систем, которые определяют эмоциональность отзывов.
В тестировании приняли участие 12 команд. Они выполнили 3 задачи. Первым заданием было проанализировать отзывы о книгах, кинолентах и цифровых камерах, а также определить, как оценивают их пользователи. Во втором задании было предложено обработать цитаты без контекста, которые организаторы взяли из новостей, и определить отношение авторов к произошедшему. И в конце участники должны были найти отзывы, оставленные в блогах, об определенных фильмах, товарах и книгах. Во время анализа отзывов точность работы алгоритмов достигала 96%, цитат из новостей - 61%. Точность людей во время работы с цитатами - 70-75%.
Работа систем определения эмоциональной окраски текста основана на методах машинного обучения и словарях. Лингвисты при составлении словарей указывают, какие слова "хорошие", а какие "плохие". Во время машинного обучения компьютеру предоставляют примеры отзывов с пометками, где положительные, а где отрицательные. Так, например, союз "но" говорит об отрицательной оценке.