При сборе и накоплении большого объема данных мы получаем, с одной стороны, важную базу для анализа и исследования, но с другой – огромный массив, который требует систематизации и обработки.
Как мудро заметил в одной из своих статей на Slon.ru Андрей Мирошниченко, «Навигация – единственный информационный продукт, чья ценность будет расти, с увеличением объемов информации».
Если переходить к инструментам навигации, представленным в различных мониторинговых платформах, то среди самых «базовых» и распространенных можно выделить распределение по тематическим рубрикам (категориям) и тональности упоминаний.
Причем тональности обычно уделяют больше всего внимания, хотя часто тональность сообщений не показывает качественного состава упоминаний и контекста обсуждений.
Рубрикация упоминаний (то есть распределение всех сообщений по определенным темам) дает более репрезентативную структуру разговоров. Однако рубрики-маяки не всегда ясны и понятны, а в случае с известными брендами часто могут работать некорректно – трудно предугадать и точно определить направления «гласа народа» и то, что будет обсуждаться аудиторией на этой неделе или тем более в следующем месяце. Кроме того, нередки случаи, когда зная, что искать, и работая только в данном направлении, все иные тренды становятся «слепым пятном» и остаются незамеченными.
Так как же научиться слушать и системно понять, о чем говорят люди в сети?
Для решения такой нетривиальной задачи применяется технология кластеризации, то есть объединение нескольких однородных элементов по определенным признакам. Кластеризация позволяет быстро сориентироваться в большом медиа-поле и сделать качественный анализ даннных.
Кластеризация позволяет быстро сориентироваться в большом медиа-поле и сделать качественный анализ даннных.
Простейший вариант кластеризации – это популярные «облака тегов» (часто встречающихся слов), которые отображают, какие слова чаще всего употребляются в рамках данной темы. Однако с учетом простоты данной технологии, облака тегов являются малоэффективными с точки зрения навигации и понимания контекста обсуждений.
Мы пошли дальше в решении задачи навигации и по уже сложившейся традиции первыми на рынке СНГ предлагаем иерархическую кластеризацию. Это позволяет не только увидеть, какие темы обсуждают вместе с вашим брендом (первый уровень), но и также узнать, какие подтемы обсуждались в рамках тем первого уровня.
Ниже вы можете увидеть пример работы кластеризации для бренда Coca-Cola на английском языке:
Нажав на сектор в диаграмме, мы можем получить детали только по сектору "Polar Beer":
Добавив Polar Beer в качестве контекста, мы можем получить кластер по Polar Beer:
Понимая важность и уникальность данной технологии для мониторинговых платофрм, мы продолжим активно развивать и совершенствовать функцию кластеризации, чтобы сделать ее еще более удобной и полезной для решения стоящих перед вами бизнес-задач.
Рекомендуем использовать кластеризацию для упоминаний на одном языке и в рамках одного типа медиа (например, все упоминания Ксении Собчак на русском в Твиттере).
Желаем продуктивной работы!
Подпишитесь и следите за нашими новостями на Facebook!
Читайте также: