Блог → 10 проблем анализа тональности (часть 1)

Устная и письменная речь различаются не только формой подачи, но часто и эмоциональной составляющей. Иногда то, что можно показать одним лишь выражением лица или интонацией голоса, приходится пояснять несколькими предложениями, чтобы вас не поняли превратно. А быстрота, особенности разговорной речи и неукротимый поток мыслей, которые характерны для онлайн-общения, добавляют сложности в понимание настроения собеседника, и потому неудивительно, что тональность и даже смысл тех или иных высказываний часто вызывает вопросы и споры.

Предлагаем ознакомиться с небольшой статьей о сложностях в определении тональности сообщений в онлайн-медиа и некоторых подводных камнях, которые вас могут ждать при их исследовании.

Популярность анализа настроений (тональности) значительно выросла в последние годы, и в настоящее время он используется для отслеживания реакции клиентов, мониторинга позиции конкурентов, предвидения результатов выборов, прогнозирования инвестиционных трендов и кассовой прибыли.

В начале мая в Нью-Йорке прошла специальная конференция Sentiment Analysis Symposium, посвященная проблемам автоматического определения тональности текстов, и стоит отметить, что выступающие, а также представители компаний и корпоративных клиентов в этой области, придерживались разных взглядов по этой непростой теме.

Очень важно понимать «социальный интеллект», в том числе драйверы настроений, которые помогут разобраться в первоначальных мотивах и причинах возникновения комментариев.

Крис Франк (Chris Frank), вице-президент компании American Express, подчеркнул, что необходимо уделять большее внимание изучению настроений, полученных из анализа сообщений потребителей, в то время как сейчас основные силы направлены только на их сбор. Уэйн Аманд (Wayne St. Amand), вице-президент по маркетингу в Crimson Hexagon добавил, что очень важно понимать «социальный интеллект», в том числе драйверы настроений, которые помогут разобраться в первоначальных мотивах и причинах возникновения комментариев. Несмотря на то количество времени, которое затрачивается на прослушивание и кодирование чувств, точность их определения по-прежнему оставляет желать лучшего.

Ниже мы собрали основные проблемные места анализа тональности сообщений. Не столь важно, проводите ли вы мониторинг социальных медиа самостоятельно или с помощью специализированных систем, обязательно ознакомьтесь с этим списком "слабых мест", которым необходимо уделить особое внимание при работе с упоминаниями.

1. Сарказм: это одно из самых сложных чувств для автоматического отслеживания и правильной интерпретации. Пример: "Какая чудесная у них служба поддержки, через три дня перезвонили".

2. Самолюбование: когда при мониторинге социальных сетей появляются записи, связанные с вашими собственными рекламными усилиями, и их необходимо отфильтровать. 

3. Нейтральные настроения: похожи на «неопределившихся» избирателей на выборах, чьи голоса могут решить исход борьбы. Их можно разделять их на конкретные темы, чтобы раскрыть каждое мнение подробнее.

4. Сравнительное настроение: не классический негатив, но тем не менее, может иметь отрицательный окрас. Пример: "Я купил iPhone", что хорошо для Apple, но не для Nokia.

5. Смешанные или многомерные настроения: содержат позитивы и негативы в одной и той же фразе. Пример: "Мне нравится сериал Mad Men, но меня раздражают навязчивые трейлеры новых серий".

6. Условное настроение: связано с действиями, которые могут произойти в будущем. Пример: клиент не раздражен сейчас, но говорит, что будет, если представители компании не перезвонят ему.

7. Положительные чувства могут быть не связаны с основной темой. Например, многие комментарии об актерах сосредоточены на их личной жизни, а не актерском мастерстве.

8. Негативные настроения не обязательно плохие: Это связано с классической дилеммой PR в отношении негативного освещения в СМИ. Пример: появление известного американского политика Сары Палин на одном из тв-шоу вызвало много негативных комментариев, но все же значительно увеличило общий рейтинг.

9. Неоднозначные негативные слова: их контекст должен быть разобран и помечен соответствующим образом. Фраза «Какой прыжок, с ума сойти!» (пример на английском - “That backflip was so sick”) носит положительный окрас, хотя в другом контексте эти слова могли быть истолкованы иначе.

10. Остерегайтесь синдрома Google Translate: проявление эмоций на Западе и в Азии сильно различаются, так же как и различаются даже смысл смайликов, поэтому такие сообщения надо интепретировать особенно внимательно.

The Wall Street Journal часто использоует данные из NetBase для отслеживания настроения в Twitter и Facebook вокруг актуальных тем. Не так давно они анализировали реакцию общественности на высокую цену продажи знаменитой картины “Крик” Мунка. Что любопытно, в то время как цена картины вызвала смешанные мнения, то эмоции по поводу самой картины были единообразны у всех.

Читайте продолжение статьи здесь.

Материал подготовлен на основе: http://www.mediabistro.com/prnewser/37705-sentiment-analysis_b37705

Автор:
Manager of Linguistic Products Department

Читайте также:

Добавить комментарий:

Blog comments powered by Disqus