Старый, но не бесполезный. Кластер на основе ускорителей Nvidia H100 установил мировой рекорд по производительности при обработке графов — Несмотря на то, что ускорители H100 уже далеко не лидеры рынка по производительности, именно на них основана система, установившая новый мировой рекорд. Nvidia похвасталась, как кластер H100 на облачной платформе CoreWeave AI побил рекорд производительности Graph500. Рекордный результат составил 410 трлн TEPS. TEPS в этом случае обозначает Traversed Edges Per Second, то есть число ребер в графе в секунду. Фото Nvidia В ходе тестирования, проведенного на кластере, размещенном в ЦОД CoreWeave в Далласе, для обработки графа с 2,2 трлн вершин и 35 трлн ребер было использовано 8192 ускорителей H100. Система не просто установила рекорд — результат более чем вдвое превосходит производительность аналогичных решений в списке. Компания Nvidia предлагает аналогию для того, чтобы проще понять масштаб вычислений. Чтобы представить масштаб этой производительности, предположим, что у каждого человека на Земле 150 друзей. Это соответствовало бы 1,2 триллионам связей в графе социальных отношений. Уровень производительности, недавно достигнутый NVIDIA и CoreWeave, позволяет осуществлять поиск по всем дружеским связям на Земле всего за три миллисекунды. Этот прорыв имеет огромное значение для высокопроизводительных вычислений. Такие области высокопроизводительных вычислений, как гидродинамика и прогнозирование погоды, используют аналогичные разреженные структуры данных и модели обмена данными, которые лежат в основе графов, лежащих в основе социальных сетей и кибербезопасности. На протяжении десятилетий эти области были привязаны к процессорам в самых больших масштабах, даже когда объем данных увеличивался от миллиардов до триллионов связей. Победа NVIDIA в рейтинге Graph500, наряду с двумя другими работами из первой десятки, подтверждает новый подход к высокопроизводительным вычислениям в больших масштабах. Благодаря комплексной интеграции вычислительных, сетевых и программных решений NVIDIA, разработчики теперь могут использовать такие технологии, как NVSHMEM и IBGDA, для эффективного масштабирования своих крупнейших высокопроизводительных вычислительных приложений, обеспечивая суперкомпьютерную производительность на коммерчески доступной инфраструктуре.