Получи случайную криптовалюту за регистрацию!

Наверное, все уже слышали, а если не слышали, то вот: DeepMind | DLStories | Нейронные сети и ИИ

Наверное, все уже слышали, а если не слышали, то вот: DeepMind представили AlphaCode: нейросеть, которая решает задачи с Codeforces лучше, чем 54% пользователей.

В архитектуре AlphaCode нет ничего необычного: это encoder-decoder с 41 миллиардом параметров. Как и в стандартных NLP задачах, encoder принимает на вход условие задачи, decoder генерирует ответ токен за токеном. Обучается все end-to-end без всяких хитростей. Обучается это все на датасете, который был собран с GitHub, всего около 715.1 Gb кода.

Интересная же часть AlphaCode — это то, как выбирается итоговое решение. Чтобы получить хороший ответ, AlphaCode подают на вход условие задачи и просят модель выдать огромное количество вариантов решения — около миллиона. Затем из этого миллиона кучей эвристик выбирается несколько (около 10) лучших решений. Эвристики включают:
- фильтрацию решений по прохождению тестов к задаче (не скрытых, а тех, что даны в условии задачи). Выбираются только те решения, которые прошли все тесты. Такая фильтрация сразу выкидывает около 99% выданных решений.
- кластеризацию оставшихся после фильтрации решений. Для этого DeepMind натренировали еще одну модель, которая может генерировать тесты к задачам. Сгенеренные тесты не всегда получаются валидными, но этого досататочно, чтобы кластеризовать выдачу AlphaCode на кластеры по результатам прохождения этих псевдо-тестов. Далее из каждого кластера выбираются по нескольку лучших решений. Эти решения и сабмитятся на Codeforces.

Такая вот штука. Если покопаться в памяти (и нашем канале, хехе) можно вспомнить, что нечто похожее делали OpenAI — Codex. Напомним, Codex — модель для помощи написания кода: она может дополнять код программиста большими логичными кусками. О Codex мы писали тут. Если интересно, в чем отличие архитектуры Codex и AlphaCode — читайте вот тут.

Ссылки:
блогпост DeepMind
статья DeepMind
твит DeepMind