Самообучаемая модель mGPT сможет создавать тексты на 61 языке мира
Самообучаемая модель mGPT сможет создавать тексты на 61 языке мира
Самообучаемая модель mGPT сможет создавать тексты на 61 языке мира
SberDevices представила многоязычную версию нейросети GPT-3: модель под названием mGPT может генерировать тексты на 61 языке мира, включая языки народов России и стран СНГ.
Это первая в мире генеративная модель, которая поддерживает такое количество языков. Она доступна в двух версиях: базовой, с 1,3 миллиарда параметров, опубликованной в открытом доступе в облачном хранилище СберДиск, и расширенной, с 13 миллиардами параметров, которая скоро станет доступна на платформе машинного обучения ML Space от SberCloud.
Модель mGPT может использоваться как просто для генерации текста, так и для решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей. Она может также использоваться как компонент различных речевых технологий — например, для улучшения качества распознавания речи, генерации сценариев диалоговых систем и т. д.
Денис Филиппов, CEO SberDevices, вице-президент по новым цифровым поверхностям Салют Сбербанка:
«В 2020 году мы представили русскоязычную версию нейросети GPT-3, именно она используется в двух виртуальных ассистентах семейства Салют от Сбера — Джой и Афине, — отметил CEO SberDevices, вице-президент по новым цифровым поверхностям Сбербанка Денис Филиппов. — Мы продолжили развивать наши NLP-технологии и представили модель mGPT, поддерживающую более 60 языков, при этом для многих из них ранее генеративных моделей просто не существовало. Это среди прочего станет нашим вкладом в сохранение и развитие языков народов России: mGPT умеет генерировать тексты, например, на татарском или якутском».
Русскоязычная версия GPT-3, разработанная Сбером, уже доступна на платформе SmartMarket.