За 6 часов мы запустили новый проект MTEngine по оценке и улучшению машинного перевода. Проекту нужны волонтёры, смело пишите мне письма (все адреса на сайте проекта). Записывайтесь в группу вконтаке.
Google and document cloud is finally here!
Прошло почти 10 месяцев со дня предыдущего поста. За это время происходили разные интересные вещи, о которых мы поведаем позже. А наиболее терпеливые из вас и те, кто оказался здесь случайно, получают редкую возможность посмотреть на облако слов в новом свете: в свете результатов поиска в Google. После того, как Вы ввели запрос, мы построим облако наиболее часто встречающихся слов в документе, который Вы ещё даже не открыли. Проверьте, есть ли польза от облака слов, как от краткого изложения документа? Результаты поиска получаются через Google CustomSearch API, который позволяет делать всего лишь 100 запросов в день, поэтому если на экране появится сообщение Daily limit exceeded, не пугайтесь, а лучше напишите нам письмо. Мы что-нибудь придумаем!
Как всегда, будем рады комментариям!
Google и облако документа: coming!
Мы решили поэкспериментировать с нашим продуктом семантического облака и интегрировать его с поиском Google. Идея простая: до того, как вы кликните на ссылку в списке хитов Google, можно заранее вкратце ознакомиться с тем, о чём там будет говориться. То есть что-то вроде машины времени, которая из будущего передаёт вам информацию о странице, на которую вы ещё только собираетесь взглянуть.
Посмотреть и поиграть с сервисом скоро можно будет на нашем сайте.
После того как вы введёте ключевые слова (например, “социальная сеть”), отобразится список хитов поисковой системы. Ещё через некоторое время под каждым хитом отобразится его семантическое облако или облако наиболее часто встречающихся слов:

Мы надеемся, что это будет полезным инструментом. Да, если вы хотите интегрировать данный продукт в своей системе или на сайте, пишите нам на info@semanticanalyzer.info.
Семантические облака
Да-да, такие, оказываются, тоже бывают. Для чего они нужны?
Предположим, у Вас есть текст (большой или маленький). Вы хотите быстро узнать, о чём он, заглянув вглубь. Сделать это можно, произведя морфологический анализ (с) и отсортировав полученные термины по частоте встречаемости.
Само облако доступно в виде библиотеки (jar или C# dll) для удобной интеграции в Ваше приложение (веб или прикладное).
Демо тоже доступно — в том же месте, в тот же час.
Наш семинар на mathlingvo.ru
5 декабря мы провели семинар в Санкт-Петербурге, где рассказали о теории семантико-синтаксического анализа русского языка. Также были затронуты вопросы использования нашей библиотеки морфологического анализа.
Было приятно выступать перед интересной и любознательной аудиторией! Особая благодарность организаторам семинара.
Talk in FRUCT: a fruitful talk
Having an idea is a half of story. Sharing the idea makes part of another half. What remains there in the complete basket is to be seen.
Giving a talk in the event organised by Nokia Research, Helsinki University of Technology and Nokia Siemens Networks is an honor and pleasure at the same time. Talking about ideas already implemented in software makes a talk fruitful. How to help public to get along with such a challenging topic as semantic analysis? Talk about use cases! Some of them are flying in the air, some of them we have found in colleagues’ minds. How to make it possible with quick theory explanation just in 15 minutes? Well, hm. Make jokes! With no further ado goes our presentation:
P.S. Do you like commenting? We love reading! Have a cup of tea / coffee and go ahead!
Интервью @ spbhackday @ youtube
Когда возникает идея, хорошо её проверить. spbhackday — одна из таких возможностей.
5-6 сентября, 2009, Санкт-Петербург
Анонс нашей презентации на mathlingvo.ru
Скоро мы собираемся дать презентацию по технологии морфологического и семантико-синтаксического анализа в Санкт-Петербурге. Семинар пройдет 5 декабря в гостях у проекта mathlingvo. Слайды и материалы доклада потом будут доступны в онлайн. Читайте наш анонс и добро пожаловать на семинар!
Morphological Analyzer library is available for download!
Now you can download and try our Morphological Analyzer library. The package contains a Windows 32-bit DLL library with a base dictionary, plus you can connect your custom user dictionary with new words. Guesser for unknown words is also there!
Теперь вы можете загрузить и попробовать нашу бибилотеку Морфологического Анализатора. Пакет для загрузки содержит 32-х битную версию DLL библиотеки для Windows с базовым словарем, плюс вы можете подсоединить свой пользовательский словарь с новыми словами. Подбор для неизвестных слов также доступен!
Morphological Analyzer Guesser
Our Morphological Analyzer now can guess base-forms of the unknown words! Check our Demo page. Input some newish or slang words, select “Guess lemmas for unknown words” option and press “Do Morphological Analysis” button. Have fun!
Наш Морфологический Анализатор теперь может угадывать основные формы для неизвестных слов! Зайдите на нашу демонстрационную страницу, введите какие-нибудь новомодные или сленговые слова, выберите опцию “Подобрать леммы для неизвестных словоформ” и нажмите кнопку “Do Morphological Analysis”.