QVABO STUDIO
AI

🤩 OpenAI, AMD, Broadcom, Intel, Microsoft и NVIDIA представили новый сетевой протокол MRC

OpenAI совместно с AMD, Broadcom, Intel, Microsoft и NVIDIA разработала сетевой протокол MRC (Multipath Reliable Connection). Он призван ускорить и сделать более предсказуемой передачу данных между GPU в крупных AI-суперкомпьютерах - критически важное условие для обучения больших моделей.

🤩 OpenAI, AMD, Broadcom, Intel, Microsoft и NVIDIA представили новый сетевой протокол MRC

Вместо отправки каждого потока данных по одному сетевому пути MRC распределяет пакеты одновременно по сотням маршрутов, снижая нагрузку на ядро сети. При отказе каналов или коммутаторов протокол обнаруживает проблему и перенаправляет трафик за микросекунды. Обычные сети могут стабилизироваться после сбоев секунды или даже десятки секунд. Это позволяет обучению продолжаться даже при отказах и обслуживании оборудования, которые раньше приводили к остановке.

Полная версия — в Telegram

Читать пост полностью

~1 мин чтения · @qvabo_studio

В Telegram
Оригинал
Tier-1 пресса
Qvabo Studio
Редакция
Открыть в Telegram