Спецпроекты
«Текстерра» - единственная автоматическая система, которая может понимать смысл написанного
«Текстерра» - единственная автоматическая система, которая может понимать смысл написанного
Новости
отправить
Задать вопрос
по материалу
 

В России создали уникальную программу для анализа текстов

«Текстерра» - единственная автоматическая система, которая может понимать смысл написанного

Ученые Института системного программирования (ИСП РАН) создали программу, которая позволяет проводить лингвистический анализ текстов на русском и английском языках, а также давать оценку мнениям, представленным в них. «Текстерра» вошла в единый реестр программ для электронных вычислительных машин и баз данных как уникальный продукт, разработанный в России.

Система может обрабатывать неформальные сообщения и комментарии в соцсетях и анализировать их. Программа подойдет не только лингвистам, но и представителям бизнеса для мониторинга оценки своих продуктов в соцсетях или для конкурентной разведки.

По словам заведующего информационных систем ИСП РАН Дениса Турдакова, в настоящее время программа знает свыше 7 млн понятий. Для сравнения, «Большая российская энциклопедия» содержит описание 80 тыс понятий. База «Текстерры» пополняется автоматически из интернет-энциклопедии «Википедия», а также из ресурсов MediaWiki и LinkedData.

Программа включает три модуля: лингвистический анализ, извлечение информации и анализ мнений. Как отметил директор ИСП РАН Арутюн Аветисян, главными особенностями системы является высокая скорость обработки текста, возможность добавления новых языков и адаптивность к сленгу.

Система автоматически понимает смысл текстов, в том числе определяет эмоциональную окраску сообщений, узнает людей по комментариям в соцсетях, сообщают «Известия». Сейчас «Текстерра» является единственной в России автоматической системой анализа текстов, которая способна «вдумываться» в смысл написанного.

Больше научных новостей смотрите на сайте Физтехпарка.




Подпишитесь на рассылку «Умной Страны»
Подписаться