У нас реально всё серьёзно: создаём самые сильные языковые модели в России и одни из самых больших в мире! Например, GigaChat3 Ultra
Сейчас мы в поисках специалиста, который поможет оптимизировать архитектуры под GPU и решать проблемы с масштабированием на кластера из тысяч видеокарт. Работать предстоит с современным набором: NVIDIA B200/H100!
Разберёшься с этим? Тогда откликайся на вакансию:
Technical Lead — CUDA/Triton Kernel Development for LLM Acceleration