2022-08-29 12:20:33
С ощущением жгучей зависти изучаю спецификации и показатели производительности нового китайского x86-совместимого процессора
Zhaoxin (бывш. VIA, помните такую?)
KaiSheng KH-40000/16 (и /12). Процессор с 16 ядрами (с поддержкой SMT запускается 32 потока), выполненный по 7-нм техпроцессу не показывает, надо признать, никаких чудес при сравнении с современными серверными x86-64 CPU от Intel и AMD, но это такое сравнение, неоднозначное. Потому что получился вполне годный камень для серверов начального уровня. Процессор с ядрами, уходящими корнями в очень древнюю архитектуру Centaur (кто-то помнит?) подтянутые до современных техпроцессов и с доработанной архитектурой - плюс-минус соответствует (при обработке целочисленных данных) по общей производительности пятилетнему Intel Xeon Gold 6130 Processor с теми же 16 SMT ядрами (и быстрее, чем 4-8-10-ядерные модели).
Конечно, даже старый интеловский процессор гораздо быстрее при обработке чисел с плавающей точкой (тут с Intel вообще гоняться сложно, в принципе), конечно, SIMD-расширения в реализации Intel и AMD способны показывать чудеса потоковой обработки, конечно, сегментированный на 4 части (по 8 мегабайт) кэш третьего уровня китайского процессора гораздо хуже единого 22-мегабайтового L3 у Xeon (опять же — Intel умеет делать большие и быстрые кэши, как никто), но если вам просто нужен работоспособный сервер баз данных начального уровня или база для блока огромного кластера системы искусственного интеллекта — то KaiSheng KH-40000 достаточно приемлемое решение, особенно в двухпроцессорной конфигурации. Двухпроцессорная рабочая станция на KH-40000 обеспечит общую производительность где-то между топовыми однопроцессорными решениями Intel или AMD. "
Это работает, и этим не стыдно пользоваться." Да, расход энергии будет больше, но это уже второй вопрос.
Какой вывод можно сделать? Китай имеет сегодня полностью собственную инфраструктуру вычислений на платформе x86, от ноутбуков до серверов. Обеспечивающую достаточную производительность для поддержания конкурентноспособности экономики в части рабочих мест и высокопроизводительных вычислений. Учитывая существование в Китае довольно развитой системы процессоров архитектуры LA464 Loongson, видеоадаптеров семейства JM9 и неплохих GPU Birentech BR100, позволяющих строить современные системы ИИ — уровня безопасной автономности они достигли. Да, у них нет ничего сопоставимого с AMD EPYC Genoa, Intel Xeon Sapphire Rapids или NVIDIA H100, но
качественного разрыва уже нет.
P.S. Кстати, отставание KaiSheng KH-40000 от топовых 16-ядерных процессоров Intel и AMD в однопоточной целочисленной обработке (в 2-3 раза) примерно соответствует отставанию по частоте. Что говорит о неплохом уровне самой архитектуры ядер.
P.P.S. Никак не соберусь дописать капитальный труд о роли кэширования данных, но имейте в виду: размер имеет значение.
526 viewsИлья Вайцман, edited 09:20