Смотрите, какую интересную штуку нашли у GPT-3-подобных моделе | DLStories | Нейронные сети и ИИ

Смотрите, какую интересную штуку нашли у GPT-3-подобных моделей: если в zero-shot режиме добавить в конец текста запроса языковой модели фразу "Let’s think step by step", качество ее ответов улучшается в разы! Например, модель вдруг начинает уметь в логику и правильно решать арифметические задачи (см. фото к посту).
Мне кажется, это отлично демонстрирует, насколько все же далеки большие языковые модели от понимания мира и "общего разума"

Ну что, пора организовать конкурс: тюнить модели находить правильные фразы для добавления в инпут GPT-3 для решения разных задач: арифметических, логических и т.д. Выигрывает тот, чья модель сможет получить лучший средневзвешенный скор на всех датасетах для этих задач =)

P.S. Кстати, вчера было ровно два года с выхода GPT-3 в свет: 28 мая 2020 года выложили статью Language Models are Few-Shot Learners. Всего два года, а сколько всего уже успело произойти, с ума сойти!

DLStories | Нейронные сети и ИИ

👨‍🚀 13.15K
Технологии

Новинки искусственного интеллекта и нейронных сетей. Разборы статей. Ну а вообще, посчу, что захочу :) . Сотруд�...

Join
▲ Vote (1)

Смотрите, какую интересную штуку нашли у GPT-3-подобных моделе | DLStories | Нейронные сети и ИИ

Login