Недавно вышла статья Large Language Models are Zero-Shot Reaso | я обучала одну модель

Недавно вышла статья Large Language Models are Zero-Shot Reasoners, где авторы показывают, что просто добавление «Let’s think step by step» в промт большой языковой модели позволяет ей бустить качество на многих задачах в несколько раз без файнтюна в zero-shot И внезапно модель обретает способности к математике и логике, с которыми у LM обычно дикие проблемы. В частности на арифметических задачках датасета MultiArith точность поднимается с 17.7% до 78.7%

я обучала одну модель

🦹 2.61K
Технологии

Shitposting on various subjects. Ответственная за шитпост: @exitcodezero

Join
▲ Vote (1)

Недавно вышла статья Large Language Models are Zero-Shot Reaso | я обучала одну модель

Login