Компания Moore Threads на данный момент выпускает самые производительные видеокарты, если говорить о китайских разработках. Согласно её собственным тестам, её адаптер MTT S4000 в задачах ИИ может соперничать с картами Nvidia.
MTT S4000 был представлен в конце прошлого года, и это решение, изначально нацеленное на ЦОД и ИИ. Производительность адаптера в режиме FP32 составляет 25 TFLOPS, что немного ниже, чем у RTX 4070, а в режиме FP16/BF16, который важнее для ИИ, она достигает уже 100 TOPS. В режиме INT8 речь о 200 TOPS.
Но это теоретическая производительность. На практике же при обучении языковой модели MT-infini-3B с тремя миллиардами параметров система на основе ускорителей Moore Threads показала результаты, сопоставимые с продуктами Nvidia.
Правда, есть важные нюансы. Во-первых, сравнение проводилось при обучении разных языковых моделей, что уже не особо репрезентативно. Во-вторых, нет никаких подробностей о том, какие именно ускорители Nvidia использовались для сравнения, в каких количествах, и даже относительно китайской системы таких подробностей нет. Конечно, авторы могли сделать сравнение максимально корректным, насколько у них это получалось, но мы об этом знать не можем.
Впрочем, для самой Moore Threads, возможно, противопоставление ускорителям Nvidia не так и важно, так как сейчас китайский рынок нацелен на тотальное замещение зарубежной продукции своими разработками.