Google and document cloud is finally here!

Прошло почти 10 месяцев со дня предыдущего поста. За это время происходили разные интересные вещи, о которых мы поведаем позже.  А наиболее терпеливые из вас и те, кто оказался здесь случайно, получают редкую возможность посмотреть на облако слов в новом свете: в свете результатов поиска в Google. После того, как Вы ввели запрос, мы построим облако наиболее часто встречающихся слов в документе, который Вы ещё даже не открыли. Проверьте, есть ли польза от облака слов, как от краткого изложения документа? Результаты поиска получаются через Google CustomSearch API, который позволяет делать всего лишь 100 запросов в день, поэтому если на экране появится сообщение Daily limit exceeded, не пугайтесь, а лучше напишите нам письмо. Мы что-нибудь придумаем!

Как всегда, будем рады комментариям!

Google и облако документа: coming!

Мы решили поэкспериментировать с нашим продуктом семантического облака и интегрировать его с поиском Google. Идея простая: до того, как вы кликните на ссылку в списке хитов Google, можно заранее вкратце ознакомиться с тем, о чём там будет говориться. То есть что-то вроде машины времени, которая из будущего передаёт вам информацию о странице, на которую вы ещё только собираетесь взглянуть.

Посмотреть и поиграть с сервисом скоро можно будет на нашем сайте.

После того как вы введёте ключевые слова (например, “социальная сеть”), отобразится список хитов поисковой системы. Ещё через некоторое время под каждым хитом отобразится его семантическое облако или облако наиболее часто встречающихся слов:

облако слов

Мы надеемся, что это будет полезным инструментом. Да, если вы хотите интегрировать данный продукт в своей системе или на сайте, пишите нам на info@semanticanalyzer.info.

Семантические облака

Да-да, такие, оказываются, тоже бывают. Для чего они нужны?

Предположим, у Вас есть текст (большой или маленький). Вы хотите быстро узнать, о чём он, заглянув вглубь. Сделать это можно, произведя морфологический анализ (с) и отсортировав полученные термины по частоте встречаемости.

Само облако доступно в виде библиотеки (jar или C# dll) для удобной интеграции в Ваше приложение (веб или прикладное).

Демо тоже доступно — в том же месте, в тот же час.

Наш семинар на mathlingvo.ru

5 декабря мы провели семинар в Санкт-Петербурге, где рассказали о теории семантико-синтаксического анализа русского языка. Также были затронуты вопросы использования нашей библиотеки морфологического анализа.
Было приятно выступать перед интересной и любознательной аудиторией! Особая благодарность организаторам семинара.

Анонс нашей презентации на mathlingvo.ru

Скоро мы собираемся дать презентацию по технологии морфологического и семантико-синтаксического анализа в Санкт-Петербурге. Семинар пройдет 5 декабря в гостях у проекта mathlingvo. Слайды и материалы доклада потом будут доступны в онлайн. Читайте наш анонс и добро пожаловать на семинар!

Morphological Analyzer library is available for download!

Now you can download and try our Morphological Analyzer library. The package contains a Windows 32-bit DLL library with a base dictionary, plus you can connect your custom user dictionary with new words. Guesser for unknown words is also there!

Теперь вы можете загрузить и попробовать нашу бибилотеку Морфологического Анализатора. Пакет для загрузки содержит 32-х битную версию DLL библиотеки для Windows с базовым словарем, плюс вы можете подсоединить свой пользовательский словарь с новыми словами. Подбор для неизвестных слов также доступен!

Morphological Analyzer Guesser

Our Morphological Analyzer now can guess base-forms of the unknown words! Check our Demo page. Input some newish or slang words, select “Guess lemmas for unknown words” option and press “Do Morphological Analysis” button. Have fun!

Наш Морфологический Анализатор теперь может угадывать основные формы для неизвестных слов! Зайдите на нашу демонстрационную страницу, введите какие-нибудь новомодные или сленговые слова, выберите опцию “Подобрать леммы для неизвестных словоформ” и нажмите кнопку “Do Morphological Analysis”.