Новая модель управления сетью ЦОД с помощью NVIDIA Linux Switch

Автор: NVIDIA РОССИЯ

Представьте себе вы ужинаете в хорошем ресторане. Вы смотрите в меню и решаете заказать стейк средней прожарки. Официант приносит красиво сервированный стейк, обслуживание отличное. Тем не менее, тихий голос в голове нашептывает: «Я мог бы приготовить этот стейк у себя на кухне лучше!»

У всех нас было такое чувство. Иногда, чтобы добиться идеального результата, нужно приложить собственные усилия. В компании «Яндекс» это хорошо понимают, поэтому заключили партнерское соглашение с NVIDIA, чтобы использовать решение Linux Switch на Ethernet коммутаторах NVIDIA Spectrum. По мере развития открытой экосистемы сетевого ПО NVIDIA имеет уникальные возможности для поддержки таких пионеров в своей области, как «Яндекс».

Как поясняет Антон Кортунов, технический лидер команды NetDev в «Яндексе»: «У Яндекса несколько центров обработки данных, каждый из которых состоит из десятков или даже сотен тысяч серверов, соединенных тысячами коммутаторов. Управление этой инфраструктурой – непростая задача».

«Яндекс» использует облачные операционные модели, чтобы сделать развертывание, администрирование и автоматизацию ЦОД максимально эффективными и простыми при минимальных затратах.

Технологические идеи

Помимо общих требований к эффективности и экономичности облачного масштаба, у «Яндекса» было еще несколько требований к сетевым решениям:

  • центры обработки данных компании широко используют IPv6; в частности, BGP-сессии внутри сети на  IPv6 link-local адресах;
  • требовались инструменты QoS и ACL, и любой сетевой стек должен интегрироваться с инструментами телеметрии, мониторинга и автоматизации;
  • инфраструктура сетевого коммутатора, поддерживающая расширенные возможности ZTP (Zero-Touch Provisioning). В частности, механизм ZTP необходимо было связать с инструментами мониторинга, чтобы проверять развертывание и успешно завершить процесс в масштабе.

С учетом данных требований, в «Яндексе» рассмотрели несколько вариантов. В компании решили, что для желаемой интеграции и автоматизации им нужна открытая сетевая ОС. Рассматривался вариант SONiC, но у него было слишком много ограничений в части поддержки IPv6. Тогда появился вариант с NVIDIA Linux Switch.

Что такое Linux Switch?

NVIDIA Linux Switch позволяет клиентам запускать любой дистрибутив Linux в качестве сетевой операционной системы на Ethernet коммутаторах Spectrum. Ключевым ингредиентом для Linux Switch является Switchdev, драйвер ядра Linux, на которой основан Linux Switch.

Как и в случае с серверной операционной системой, Linux Switch создан, чтобы обеспечить независимость. Вместо проприетарных API-интерфейсов для управления чипом (ASIC) коммутатора используются полностью стандартные интерфейсы ядра Linux. Это позволяет независимо выбирать железо коммутатора, а также любой дистрибутив Linux в качестве сетевой ОС, при этом не теряя в производительности за счет использования аппаратного offload.

Рис. 1. Стэк NVIDIA Linux Switch

Linux Switch обеспечивает «Яндексу» несколько преимуществ. Как было сказано выше, у компании было несколько ключевых требований, которым должна соответствовать любая сетевая ОС. Использование Linux Switch обеспечивает «Яндексу» гибкость в кастомизации и оптимизации коммутатора под их собственные нужны, без необходимости поддерживать неиспользуемые функции в сетевой ОС, повышающих стоимость такого решения.

Прозрачность Linux Switch и операционной модели Linux также обеспечивает «Яндексу» полный контроль над сетевой ОС и ПО коммутатора, что значительно упрощает устранение неполадок. Это позволило компании добавить в свою сетевую инфраструктуру свой собственный инструментарий для автоматизации и управления конфигурацией.

Объединив Linux Switch с этими инструментами, команда «Яндекса» получила полный контроль над функциональностью коммутатора без необходимости создавать его операционную систему с нуля.

Почему именно NVIDIA?

Будучи частью ядра Linux, Switchdev не имеет никаких ограничений со стороны платформы NVIDIA Spectrum. Что именно делает NVIDIA Linux Switch правильным выбором?

Во-первых, оборудование имеет значение. Программно-определяемые аппаратно-ускоренные решения NVIDIA делают Spectrum уникальным выбором для Switchdev. С каждым новым ASIC и платформой коммутатора, поддержка и совместимость Switchdev является одним из первых вопросов на этапе проектирования «железа», и каждый Ethernet коммутатор NVIDIA поддерживает Linux Switch.

Во-вторых, широкий диапазон поддерживаемых скоростей (от 1 до 400 Гбит/с) и форм-факторов (1U или 2U, а также половинной ширины) позволяет коммутаторам Spectrum удовлетворять любые потребности в сетях ЦОД.

Дополняя своими решениями портфель оптимизированного оборудования, NVIDIA является ключевым участником экосистемы сетевых решений с открытым исходным кодом. NVIDIA работает с сообществом разработчиков открытого ПО для решения проблем клиентов. Новая функциональность и дополнительные оптимизации, используемые в решении Linux Switch, которые выполнены инженерами NVIDIA, также входят и во все основные дистрибутивы Linux.

Рис. 2. NVIDIA Open Ethernet

С Linux Switch на коммутаторах Spectrum, «Яндекс» получил прозрачность и контроль над сетью, дезагрегировал сетевое «железо» и «софт», а также снизил свои затраты на сеть. По словам Антона Кортунова, они достигли своей основной цели, сделав так, чтобы whitebox-коммутаторы могли вести себя, с точки зрения эксплуатации, так же, как и их существующие решения от вендоров. Компания получила все плюсы проприетарных вендорских решений без каких-либо негативных последствий, обычно связанных с vendor-lock.

Узнать больше подробностей о подготовке и эксплуатации командой «Яндекса» решения Linux Switch можно из докладов Антона Кортунова на недавних конференциях: