Получи случайную криптовалюту за регистрацию!

Улучшенные языковые модели, интеграция AI во все сервисы — на | GigaChat

Улучшенные языковые модели, интеграция AI во все сервисы — на ежегодной конференции Google I/O 2024 анонсировали
ряд громких новинок, достойных отдельного дайджеста.

Gemma — семейство моделей с открытым кодом, основанное на технологиях Gemini — пополнили новички: CodeGemma (для помощи при написании кода), Recurrent Gemma (для оптимального использования памяти) и PaliGemma (для мультимодальных задач на стыке языка и изображений). Также анонсировали Gemma 2 с 27 млрд параметров (для сравнения, у версий, доступных сегодня, 2 и 7 млрд параметров).

Улучшенная Gemini 1.5 Pro, которая сможет анализировать до 2 миллионов токенов. Мультимодальная Gemini 1.5 Pro будет интегрирована во все сервисы Google. Модель сможет взаимодействовать с вашим Google Disk, появится в почте и в офисных сервисах.

Gemini Nano — самая лёгкая модель от Google — будет встроена в десктопное приложение Chrome, а также появится на Android. Это мультимодальная и автономная модель, поэтому она может работать с разными типами информации даже без интернета.

Veo — модель, способная создавать видеоклипы в разрешении 1080p длительностью около минуты на основе текстового описания. Veo может передавать различные визуальные и кинематографические стили и редактировать уже сгенерированные кадры. И, кстати, можно вписаться в лист ожидания.

Imagen 3 — новая версия модели генерации изображений, которая лучше понимает текстовые запросы и обрабатывает текст, генерирует более креативные и детализированные изображения.

Project Astra — AI-ассистент сможет быстро отвечать на вопросы пользователя о том, что происходит на видео, которое в реальном времени пишется с телефона или умных очков.

Music AI Sandbox — AI-инструмент для работы с музыкой.