В России разработали новый метод обучения больших языковых моделей
В России разработали новый метод обучения больших языковых моделей
Наука и технологии
отправить
Задать вопрос
по материалу
 

Рассуждающие модели ИИ хотят сделать доступными для небольших компаний

В России разработали новый метод обучения больших языковых моделей

T-Bank AI Research совместно с Центральным университетом разработали метод обучения больших языковых моделей (LLM), который позволяет развивать у них способность к логическим рассуждениям без использования дорогостоящих вычислительных ресурсов. Результаты исследования были представлены на международной конференции по эмпирическим методам обработки естественного языка (EMNLP 2025).

 

Согласно материалам, с которыми ознакомилась «Российская газета», новый подход не только снижает затраты на обучение, но и помогает лучше понять механизмы формирования рассуждений у ИИ. Разработка делает возможным создание рассуждающих моделей не только в крупных технологических корпорациях, но и в университетских лабораториях и небольших компаниях.

 

Традиционно для улучшения логических способностей языковых моделей используется обучение с подкреплением (reinforcement learning), предполагающее корректировку миллиардов параметров — элементов модели, отвечающих за хранение знаний и алгоритмов работы. Такой процесс требует значительных вычислительных и финансовых ресурсов.

 

Команда T-Bank AI Research предложила альтернативный подход: вместо масштабного изменения архитектуры модели применяются векторы-настройки — компактные наборы параметров, усиливающие правильные логические шаги уже предобученной модели. Эти векторы действуют как «регуляторы громкости»: они не меняют логику модели, а делают более выраженными корректные рассуждения.

 

«Наш метод показывает, что развивать способность к рассуждениям можно без масштабного пересмотра параметров модели. Это открывает путь к созданию доступных решений искусственного интеллекта для бизнеса и образования», — отметил Вячеслав Синий, исследователь лаборатории AI Alignment T-Bank AI Research.

 

Разработанный метод продемонстрировал эффективность на шести международных бенчмарках по математическому рассуждению, сохранив качество работы моделей на уровне до 100%.

 

Иллюстрация freepik, автор: freepik, создано с помощью нейросети.


Подпишитесь на рассылку «Умной Страны»
Подписаться