YaLM 100B [1] GPT-подобная нейросеть для обработки и создания | Ivan Begtin
YaLM 100B [1] GPT-подобная нейросеть для обработки и создания текста. Доступна под лицензией Apache 2.0 и вчера выложена командой Яндекса на Github.
Авторы заявляют 100 миллиардов параметров, отсюда 100B в названии, и то что модель создавалась на основе 1.7 ТБ текстов и рассчитывалась 65 дней на кластере из 800 видеокарт A100.
I write about Open Data, Data Engineering, Government Technologies, Privacy and Digital Preservation and other gov and tech stuff. Chat https://telegram.me/begtinchat. Facebook - https://facebook.com/...