Технологии

Сбор данных

W3Monitor - мониторинг изменений и дискуссий

В системе используется технология SemanticForce W3Monitor, которая отслеживает изменения на любых ресурсах, включая сайты без RSS, фрагменты страниц, комментарии к публикациям и дискуссии на форумах.

Полнотекстовый поиск по микро-блогам (Twitter)
SemanticForce автоматически индексирует тексты статей, на которые ссылаются сообщения (твиты) в микроблогах. Это позволяет находить косвенные упоминания об объекте и значительно расширить покрытие.

Индексирование социальных сетей
Для мониторинга популярных социальных сетей: Facebook, VKontakte, GooglePlus используются собственные поисковые алгоритмы SemanticForce. Учитываются морфологические особенности и специфика конкретной сети, что позволяет значительно увеличить объем отслеживаемых упоминаний.

Мониторинг иностранных СМИ 
Широкий охват региональных и зарубежных интернет СМИ: 250,000 ресурсов в 150-ти странах мира.

Twitter Firehose
Для мониторинга высокочастотных объектов используется технология Twitter Firehose, которая позволяет получать данные из Twitter без задержек по времени и ограничений по объему выгружаемой информации.

Объектный поиск
Технология SemanticForce, которая позволяет отслеживать косвенные упоминания (без прямого упоминания бренда или продукта) на сайтах с отзывами, комментарии к товарам в Интернет магазинах и т.п.

Анализ профилей
ProfileForce
Технология позволяет отслеживать поведение автора упоминаний и его отношение к объекту мониторинга, автоматически призводить поиск его профилей в Интернет и собирать историю с целью последующего анализа и вовлечения.

Гео-сегментация
Определение географического местоположения автора сообщения. Для этого используется в том числе собственная база словарей, информация указанная в профайле пользователя, гео-теги и другие параметры.

Анализ сообщений
Детектирование объектов
Автоматическая выборка и статистика по упоминающимся в текстах компаниям, продуктам и персонам.

Иерархическая кластеризация
Технология обеспечивает навигацию по большому массиву данных, выделяя кластеры по отдельным словам, которые часто упоминаются в контексте с объектами мониторинга.

Автоматическая рубрикация
Автоматическая рубрикация найденных упоминаний с возможностью добавления новых рубрик.

Объектная тональность
Тональность определяется не для всего упоминания, а для конкретного объекта в упоминании, что позволяет формировать выборки с различной тональностью - например, в том случае, когда в одном сообщении об определенном бренде говорится позитивно, а о его конкуренте – негативно.

Визуализация
Иерархическая визуализация сообщений
В платформе SemanticForce реализована специальная архитектура для хранения, поиска и визуализации комментариев, что позволяет видеть комментарии под исходной статьей или заметкой, к которой они изначально оставлялись.

Экспорт и интеграция
Интеграция с GoogleAnalytics
В рамках платформы SemanticForce объединены медиа и веб-аналитика. В систему интегрирован самый популярный сервис веб-аналитики Google Analytics. Аналитические данные из Google Analytics можно найти в отчете по источникам.