Системы деплоя

Язык буткемпа: C++, Java, Python

Мы развиваем инфраструктурное (внутреннее) контейнерное облако, в котором расположены сервисы Яндекса от Поиска и Такси до Музыки и Карт. Всё ради того, чтобы инженеры Яндекса тратили минимум времени на запуск и эксплуатацию, а стоимость ресурсов облака была минимальной.

Под управлением внутреннего облака находятся более 100 тысяч серверов и более 70 тысяч сервисов (в сумме больше миллиона контейнеров). Технологии внутреннего облака мы создаём сами, это оркестратор (ближайший его аналог — Kubernetes), контейнерный рантайм Porto

Мы позволяем не только запускать сервисы, но и даём пользователю всё, что нужно, чтобы работать с этим сервисом: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем готовые кубики в CI/CD и не только.

Стек

Java, Go Оркестратор и другие микросервисы, хостовые агенты
Python 3 Ряд микросервисов и CLI
C++ Контейнерный рантайм

Команда

Распределенная (от Екатеринбурга до Москвы и Белграда) команда (20+ человек) сильных разработчиков с широкой экспертизой. Умеем всё от алгоритмов до построения отказоустойчивых распределенных систем. Умеем работать как в офисе, так и удалённо. Любим и умеем делиться опытом.

Особенности

  • Уникальные масштабы: тысячи серверов, миллионы контейнеров, миллионы RPS — всё это под нашим управлением.
  • Уникальный опыт: мало где представится возможность запрограммировать оркестратор и контейнерный рантайм для такого масштабного облака.
  • В актуальных проектах мы используем свежие решения, например, Java 17 и Python 3.
  • Каждый наш релиз уезжает в продакшн и непосредственно влияет на повседневную работу тысяч инженеров Яндекса.
  • Спектр задач на любой уровень подготовки, возможность роста, а также возможность принимать решения и участвовать в дизайне и архитектуре сервисов.

Что нужно принять во внимание

  • Есть сложные инженерные задачи, но нет ML.
  • Как и у многих других инфраструктурных команд, у нас есть дежурства. Мы сами следим за работоспособностью собственного продукта, а также отвечаем на запросы пользователей во внутренней поддержке. Дежурство проходит в рамках рабочего дня. Ночью и по выходным не дежурим, если только ситуация не форс-мажорная.
  • Есть legacy, но мы планово работаем над тем, чтобы перестать его использовать.

Вызовы

  • Дать инженерам Яндекса «из коробки» окружение, в котором есть всё от мониторинга и отгрузки логов до авторизации и performance-профилирования.
  • Поддержка новых сценариев настройки и эксплуатации — автоскейлинг сервисов, построение service mesh на базе своих сервисов и многое другое.
  • Повышение прозрачности жизненного цикла сервиса во внутреннем облаке — интеграция с observability-инструментами, таймлайн событий сервиса, дашборды потенциальных проблем.
  • Придумать и воплотить в жизнь десятки идей, чтобы ускорить и повысить эффективность использования аппаратных ресурсов.
Предыдущая
Следующая