Нейросеть Kandinsky 2.1 стала самым быстрорастущим сервисом в мире
- 10 апреля 2023
- administrator

Kandinsky 2.1 — бесплатная генеративная модель от Сбера стала одним из самых быстрорастущих сервисов искусственного интеллекта (ИИ) в мире. По данным разработчиков, российской нейросети потребовалось всего четыре дня, чтобы достичь отметки в один миллион уникальных пользователей. Это быстрее результата сервиса ChatGPT от OpenAI, которому потребовалось на это пять дней. Например, Instagram* зафиксировал миллион загрузок через 2,5 месяца, Facebook* набрал миллион пользователей только за десять месяцев существования.
С момента выхода Kandinsky 2.1 было сгенерировано уже более десяти миллионов изображений, а число уникальных пользователей достигло двух миллионов. Также на прошлой неделе модель Kandinsky 2.1. попала в топ-5 трендов мировых репозиториев по версии крупнейшего веб-сервиса GitHub.

Виртуальный ассистент Сбер по версии Kandinsky 2.1
Kandinsky 2.1 способна за несколько секунд генерировать изображения по их текстовому описанию на естественном языке. Модель знает 101 язык и открывает новые возможности для творчества: может смешать несколько рисунков, дорисовать изображение, создать картину в режиме бесконечного полотна (inpainting/outpainting). Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.
Нейросеть унаследовала веса предыдущей версии, обученной на одном миллиарде пар «текст — изображение», и была дополнительно обучена на 170 миллионах пар «текст — изображение» высокого разрешения. Затем она дообучалась на отдельно собранном датасете из двух миллионов пар качественных изображений. В данный сет попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей. Нейросеть также была усовершенствована за счёт новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений. Это кардинально улучшило генерацию изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 миллиарда параметров вместо двух миллиардов в Kandinsky 2.0.
Сгенерировать изображение можно в Telegram-боте, на промостранице модели, на fusionbrain.ai и на платформе ML Space в хабе предобученных моделей и датасетов DataHub. Kandinsky 2.1 доступна в мобильном приложении Салют и на умных устройствах Sber при помощи команды «Запусти художника».
*Признаны экстремистскими организациями в России.