Получи случайную криптовалюту за регистрацию!

Первую мультимодальную ИИ-модель OmniFusion 1.1. в России выло | NN

Первую мультимодальную ИИ-модель OmniFusion 1.1. в России выложили в открытый доступ. Статья про архитектуру нейросети уже на первом месте в разделе Daily trending papers на HuggingFace.

Модель работает с картинками. Она умеет объяснять, что изображено на фото, может рассказать рецепт блюда по снимку ингридиентов и проанализировать карту помещения. А еще — решить логическую задачу или написанный от руки пример. Это разработка AIRI при поддержке Sber AI и SberDevice.

Проект опубликован на GitHub и Technical Report на arXiv.