• Отфильтровано по тэгу "Семантические технологии". Сбросить?

В связи с ростом объемов сообщений в медиаполе одним из важных факторов выбора мониторинговой системы становится релевантность выборки. Результаты мониторинга формируются на основании поискового запроса, задающего критерии поиска. Этот процесс требует чёткого представления о том, каким образом целевая аудитория обсуждает бренд, и о том, какие задачи необходимо решить с помощью проводимого мониторинга.

Задача усложняется в случае детектирования упоминаний о бренде с высокой степенью омонимичности (в выборке сообщений присутствует нерелевантный шум, который по своему написанию совпадает с одним из слов из поискового запроса, но при этом содержит совершенно иной смысл). Одно дело, когда стоит задача отследить упоминания о бренде, имеющем уникальное название (Tassimo, Nivea или Avon), другое - когда торговую сеть Metro Cash & Carry необходимо "отсеять" от метро и метросексуалов, а украшения Pandora - от одноименного ящика, радиостанции, автосигнализации и т.д.

Какие сценарии улучшения релевантности выборки возможны и как минимизировать шум в результатах мониторинга? Об этом читайте подробнее в нашей новой статье.

Sentiment Analysis

В марте 2014 г. мы были спонсорами и участниками Sentiment Analysis Symposium, прошедшего в Нью-Йорке. Это мероприятие всегда собирает новаторов в области разработки решений текстовой аналитики со всего мира. Участниками симпозиума были представители таких компаний, как Accenture, Amazon, American Express, MIT Media Lab. Среди спонсоров, такие компании, как: IBM, Dell, Lexalytics, Textalytics, GNIP, SemanticForce и др.

В данной статье хотелось бы сделать краткий обзор интересных докладов.

По мнению аналитиков Forbes, одним из 5-ти ключевых трендов 2013 года будут новые решения в области визуализации и анализа больших объемов информации.

Эпоха Big Data уверенно наступает, и теперь на первый план встает уже не проблема сбора, а проблема анализа и визуализации нарастающей информационной волны. Скорость, наглядность и функциональность становятся ключевыми показателями работы аналитических систем.

В ногу со временем

Большие объемы информации требуют новых методов визуализации. Таких, в которых будут видны более глубокие и подробные взаимосвязи, элементы иерархии, соотношения между разными объектами и т.д. Как было точно подмечено одним из экспертов (David McCandless), визуализация является одной из форм сжатия данных. Таким образом, грамотная визуализация может существенно упростить процесс анализа и обработки больших массивов данных.

Предлагаем вашему вниманию перевод статьи Сета Гримеса (Seth Grimes), специалиста в области стратегической аналитики, организатора конференций, посвященных проблемам анализа тональности.

Взгляд на состояние анализа тональности и исследование будущих направлений.

В разговорах, публикациях в Интернете или социальных сетях субъективность и тональность делают человеческое общение содержательнее и богаче. При этом огромное значение для бизнеса имеет зафиксированная электронным путем тональность сообщений потребителей (то есть выражения, находящиеся выше фактов и передающие настроение автора).

Речь сейчас идет о голосе потребителя и потенциального клиента, пациента, избирателя и неформального лидера.

Выслушивание – упоминаний о брендах, жалоб на них или проблем – является первым компонентом надежной программы социальных функций. Компании, умеющие слушать, могут открыть возможности продаж, измерить удовлетворение, оценить реакции на маркетинговые кампании и темы сообщений, раскрыть основные причины событий, определить угрозу репутации и угрозу со стороны конкурентов и отреагировать на них. Именно поэтому у нас есть мониторинговые и аналитические решения – в лучших из которых использована технология анализа текста и тональности – нацеленные на Интернет и социальные медиа, а также на отзыв предприятий в обзорах, электронной почте и записях контакт-центра. Цель данных решений состоит в раскрытии бизнес-ценности в сложном, выразительном и порой сбивающем с толку человеческом языке.

В предыдущей статье мы начали рассказывать о существенном различии в устной и разговорной письменной речи и тесно связанных с этим проблемах в определении тональности сообщений. 

Продолжаем рассказывать о подводных камнях в детектировании эмоциональной составляющей комментариев и предлагаем Вашему вниманию еще несколько тонких моментов.

(Первые 10 пунктов смотрите здесь).

11. Омонимия: в случае графического совпадения написания слов, имеющих различное значение, интерпретация оценочного суждения требует, чтобы прежде было правильно определено изначальное понятие. Например, трактовка фразы "старый замок" может быть двоякой - в одном случае оно понимается как древнее сооружение (позитивный контекст), в другом слово-омоним может означать устаревшее запирающее устройство, например, в автомобиле (негативный контекст).

12. Анафорические связи: важно при определении тональности установить весь спектр анафорических связей (местоимения, замены слов и др.), присутствующих в тексте/текстах. Это позволит понять структуру и "оттенок" оценочного суждения.

Устная и письменная речь различаются не только формой подачи, но часто и эмоциональной составляющей. Иногда то, что можно показать одним лишь выражением лица или интонацией голоса, приходится пояснять несколькими предложениями, чтобы вас не поняли превратно. А быстрота, особенности разговорной речи и неукротимый поток мыслей, которые характерны для онлайн-общения, добавляют сложности в понимание настроения собеседника, и потому неудивительно, что тональность и даже смысл тех или иных высказываний часто вызывает вопросы и споры.

Предлагаем ознакомиться с небольшой статьей о сложностях в определении тональности сообщений в онлайн-медиа и некоторых подводных камнях, которые вас могут ждать при их исследовании.