Новые источники в SemanticForce: 2ch.hk [Двач]

Anonymous

В базу SemanticForce ежедневно подключается множество новых источников с различной тематикой, аудиторией и географией. О некоторых из них мы расскажем на страницах нашего блога. Открывает цикл публикаций одна из самых популярных площадок рунета - Двач. 

Как зарождался двач?

Кто скрывается за маской анонимности?

О чем пишут анонимы на самой популярной медиадоске рунета?

Cколько пишут в день? 10 000, 20 000 или 50 000 постов? А может быть больше?

Кому поклоняются аниномы?

Как уживаются на одной площадке блоггеры и мизантропы, инстаграммеры и асоциалы? 

В связи с ростом объемов сообщений в медиаполе одним из важных факторов выбора мониторинговой системы становится релевантность выборки. Результаты мониторинга формируются на основании поискового запроса, задающего критерии поиска. Этот процесс требует чёткого представления о том, каким образом целевая аудитория обсуждает бренд, и о том, какие задачи необходимо решить с помощью проводимого мониторинга.

Задача усложняется в случае детектирования упоминаний о бренде с высокой степенью омонимичности (в выборке сообщений присутствует нерелевантный шум, который по своему написанию совпадает с одним из слов из поискового запроса, но при этом содержит совершенно иной смысл). Одно дело, когда стоит задача отследить упоминания о бренде, имеющем уникальное название (Tassimo, Nivea или Avon), другое - когда торговую сеть Metro Cash & Carry необходимо "отсеять" от метро и метросексуалов, а украшения Pandora - от одноименного ящика, радиостанции, автосигнализации и т.д.

Какие сценарии улучшения релевантности выборки возможны и как минимизировать шум в результатах мониторинга? Об этом читайте подробнее в нашей новой статье.

Работая с клиентами, представляющими различные сферы бизнеса, мы заметили, что мониторинг только общеизвестных сайтов с отзывами зачастую не удовлетворяет потребности эффективного управления репутацией. Для многих отраслей важная часть порождаемого инфополя лежит в рамках узкоспециализированных ресурсов, требующих оперативного мониторинга и реагирования.

В данной статье мы акцентируем внимание на специфике работы с популярными и нишевыми сайтами, содержащими отзывы (review sites).

Часто ли сотрудники используют продукты компании в повседневной жизни? Поводом для написания этой статьи послужил подобный, "eating your own dog food", случай из жизни SemanticForce, который является показательным примером использования мониторинга социальных медиа при выборе определенного продукта.

 

 

Sentiment Analysis

В марте 2014 г. мы были спонсорами и участниками Sentiment Analysis Symposium, прошедшего в Нью-Йорке. Это мероприятие всегда собирает новаторов в области разработки решений текстовой аналитики со всего мира. Участниками симпозиума были представители таких компаний, как Accenture, Amazon, American Express, MIT Media Lab. Среди спонсоров, такие компании, как: IBM, Dell, Lexalytics, Textalytics, GNIP, SemanticForce и др.

В данной статье хотелось бы сделать краткий обзор интересных докладов.

Мониторинг обсуждений Яндекс.Маркет

Прошло уже два года, с тех пор, как мы писали о возможности отслеживать отзывы о товарах в Яндекс.Маркет. Сервис давно превратился из агрегатора цен и отзывов в комплексную e-commerce платформу.

Яндекс.Маркет - сервис для сравнения характеристик товаров и торговых площадок (интернет-магазинов). Для выбора товаров и магазинов сервис предлагает такие критерии, как:

Помимо мониторинга отзывов на товарных страницах мы разработали дополнительный набор функций для анализа Яндекс.Маркет.  

Ежедневно в социальных сетях появляются сотни тысяч сообщений, в которых пользователи сообщают о намерении совершить покупку, просят подсказать товар или услугу. На западном рынке термин Social Selling (лидогенерация/поиск потенциальных клиентов в соц-медиа) давно вошел в обиход маркетологов, его используют для обозначения определенного комплекса действий: от поиска потенциальных покупателей до совершения прямых продаж в социальных медиа. 

Примеры сообщений с намерением о покупке в социальных сетях

Существует ряд решений, в которых используются разные подходы в обнаружении целевых сообщений и механизмы взаимодействия с потенциальными клиентами. Среди известных игроков англоязычного рынка стоит отметить такие решения, как LeadSiftNet BaseLocal ResponseKite Deskи Need Tagger.

Русскоязычный рынок на данный момент слабо развит, на базе мониторинговых систем только начинают появляться системы поиска лидов, детектирования намерений и взаимодействия с потенциальными клиентами в социальных медиа. Выделение нужных дискуссионных цепочек из общего массива данных является непростой задачей из-за обилия информационного шума, наличия интернет-мемов и сложности построения лингвистических правил детектирования смысловой составляющей отдельных сообщений.

Используя мощности системы мониторинга SemanticForce и облачной платформы для анализа текстов BlueberryAPI, мы провели исследование намерений в контексте Social Selling в русскоязычных социальных медиа. Так что же хотят женщины пользователи социальных сетей?

SMM-head New Strategies GroupПосле общения с Pocket Book мы продолжаем серию интервью с нашими клиентами. В этот раз мы в гостях у Татьяны Мокренко — SMM Head в New Strategies Group. Мы решили расспросить ее о современном Social Media Marketing-е, мониторинге социальных медиа и о том, как создается уникальная ценность для бренда.

SF: Татьяна, что привело вас в SMM?
Это долгая история. По образованию я филолог, начала работать еще в университете: школа, журналистика и даже была проджектом в Kvazar-Micro. Ну а потом я оказалась в рекламе: знакомый поэт и, по совместительству, копирайтер порекомендовал меня в агентство. Оказалось, что здесь совсем другой ритм работы: всё происходит очень быстро, все что-то от тебя хотят, 3-4 часа сна в сутки – это норма. Но, как ни странно, мне понравилось! Вот так я и попала в SMM.

SF: Это скорее творческая работа или она скатывается в рутину и требует определенного уровня автоматизации?
Знаете, если бы это было рутиной, то я бы здесь долго не задержалась. В моем понимании, работа — это место, где ты проводишь огромное количество времени, а время — это твоя жизнь. Если ты не будешь получать удовольствие от работы, моральную сатисфакцию, то зачем это нужно? Если ты не любишь то, чем занимаешься, то все равно высот в этом не достигнешь. А вот если наоборот – то сможешь с легкостью работать до 12, а то и до 2 часов ночи, да еще и на выходных. И все потому, что тебе это нравится.

2013 был интересным, непростым и знаковым для нас годом! В этой статье мы традиционно подводим итоги, рассказываем о самых интересных событиях, направлениях и заглядываем в будущее.

Мы реализовали целый ряд масштабных и уникальных для индустрии проектов, а также приобрели новых стратегических партнеров. Samsung, ABBYY, Альфа-Банк, Билайн, Сбербанк и ряд других успешных компаний стали нашими клиентами и планируют расширять спектр сотрудничества в 2014.


По уже сложившейся традиции 2013 запомнился обилием конференций, круглых столов, семинаров и мастер-классов. Вот лишь некоторые из конференций: SMconf (Москва), LoyaltyForum (Киев), BIF (Алма-Аты). Мы благодарны организаторам мероприятий, будем рады новым встречам в 2014!

Анализ сообщений - один из ключевых этапов обработки больших массивов данных. Несмотря на развитие технологий автоматического анализа тональности и категоризации, ручная разметка остается актуальной, т.к. для обучения лингвистической модели необходима изначальная выборка. При проектировании обновленного интерфейса системы, мы в первую очередь уделили внимание удобству разметки сообщений, упростив этот процесс и сохранив при этом все преимущества "объектного" подхода к анализу данных. 

Существует несколько уровней детализации анализа тональности:

  • для всего сообщения в целом;
  • для отдельных объектов, упоминаемых в сообщении; 
  • для объектов и их свойств.

Мы были первыми на рынке, кто еще в "далеком" 2009 году предложил объектный подход к анализу тональности упоминаний в социальных медиа. Эта методология имеет ряд преимуществ, но сам процесс разметки сообщений занимал немного больше времени, в связи с необходимостью выбрать объект и задать полярность его упоминания в тексте. Сегодня мы рады предложить вам новый, быстрый и удобный интерфейс для анализа тональности и категоризации сообщений. 

Новый интерфейс разметки SemanticForce