Tag Archives: sentiment analysis

Fuxi API 1.2 for Chinese sentiment analysis is here

Analyzing Sina Weibo (Chinese Twitter) and Renren (Chinese Facebook) for sentiment are quite tricky. In general social media analysis, for instance for Russian is tricky. There are few reasons:

  1. Grammar: in short messages there is not much space to spell out correct grammar. So in most cases it is “broken” from the stand point of classic parsers.
  2. Words: they change frequently, following social media development of a particular news / reaction or may be even a flash mob.
  3. Sarcasm: the author does not mean the sentiment you deduce by reading it for the first time. It sometimes takes a research and find a visual item, that helps understand the sentiment:     

Fuxi API is catching up with what’s cooking in Chinese social media by analyzing a vast array of messages in Simplified and Traditional Chinese. We have just released its 1.2 version with a number of changes to better tune for the sentiment signal in the avalanche of tweets, blog posts and news articles, all in Chinese. Check it out.

JSON API анализа тональности на русском языке

На основе технологического стека SemanticAnalyzer мы запустили API анализа тональности на русском языке. Это json API, принимающий следующую структуру:

{
 "text":"some_text_in_utf-8",
 "object_keywords":"object_keywords_in_csv_in_utf-8",
 "output_format":"json or xml"
}

API синхронно выдаёт json либо xml со структурой:

json:

{
 "sentiment": "${sentimentTag}",
 "synonyms": "${synonyms}"
}

xml:

<!--?xml version="1.0" encoding="utf-8"?-->
 
  ${sentimentTag}
  ${synonyms}
 

Пример с реальным текстом:

{
 "text":"Самарские пиармены помогут уральскому самородку:
    Засекин.Ру – самарские новости и мнения экспертов #ИгорьХолманских",
 "object_keywords":"ИгорьХолманских,Игорь Холманских",
 "output_format":"json"
}

Ответ системы:

{
 "sentiment": "POSITIVE",
 "synonyms": "[ИгорьХолманских]"
}

Ответ содержит метку тональности и объект, по отношению к которому она была вычислена.

Также системой поддерживаются POST запросы со стандартным набором параметров. В этом случае в тело POST запроса передаётся urlencoded key=value строка в http формате:

text=my_text&amp;object_keywords=keyword1,keyword2,keyword3&amp;output_format={json}.

К API прилагается документация, а также примеры интеграции на Java, Node, PHP, Python, Objective-C, Ruby и .NET.

Получить доступ к API:

RussianSentimentAnalyzer API