Получи случайную криптовалюту за регистрацию!

Еще один шаг навстречу мультимодальным ИИ от запрещенной в Рос | Двоичный кот

Еще один шаг навстречу мультимодальным ИИ от запрещенной в России Meta.

Компания показала альфа-версию своего AI-швейцарского ножа для генерации чего угодно из чего угодно. В наличии:

➥Перевод картинки в аудио. (Показываешь льва – он генерирует рык).
➥Аудио в картинку. (Загружаешь рык – получаешь льва). Есть вариант с поиском в интернете и генерацией вашего собственного льва.
➥Текст в картинку и аудио. (Пишешь «рычащий лев» -- получаешь и то, и другое).
➥Аудио и картинка в новую картинку. (Загружаешь фото спящего льва и звук рыка – лев рычит).

Пожалуй, самая ожидаемая функция -- мультимодальный поиск, как в недавнем посте про поиск по видео. В дальнейшем обещают добавить осязание, обоняние и даже сигналы с МРТ мозга. Тут мой пример со львом уже не справляется (Загрузи запах льва?... Впечатления от встречи со львом?...)

Сейчас можно поиграть только с готовыми промтами на сайте. Но компания осталась верна себе, и тут же дропнула модель в Open Source, что всегда предвещает стремительное развитие функционала. Единственный крупный игрок, который использует коммьюнити разработчиков себе на пользу («планета бесплатной рабочей силы»).