Системы деплоя
Язык буткемпа: C++, Java, Python
Мы развиваем инфраструктурное (внутреннее) контейнерное облако, в котором расположены сервисы Яндекса от Поиска и Такси до Музыки и Карт. Всё ради того, чтобы инженеры Яндекса тратили минимум времени на запуск и эксплуатацию, а стоимость ресурсов облака была минимальной.
Под управлением внутреннего облака находятся более 100 тысяч серверов и более 70 тысяч сервисов (в сумме больше миллиона контейнеров). Технологии внутреннего облака мы создаём сами, это оркестратор (ближайший его аналог — Kubernetes), контейнерный рантайм Porto
Мы позволяем не только запускать сервисы, но и даём пользователю всё, что нужно, чтобы работать с этим сервисом: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем готовые кубики в CI/CD и не только.
Стек
Java, Go | Оркестратор и другие микросервисы, хостовые агенты |
---|---|
Python 3 | Ряд микросервисов и CLI |
C++ | Контейнерный рантайм |
Команда
Распределенная (от Екатеринбурга до Москвы и Белграда) команда (20+ человек) сильных разработчиков с широкой экспертизой. Умеем всё от алгоритмов до построения отказоустойчивых распределенных систем. Умеем работать как в офисе, так и удалённо. Любим и умеем делиться опытом.
Особенности
- Уникальные масштабы: тысячи серверов, миллионы контейнеров, миллионы RPS — всё это под нашим управлением.
- Уникальный опыт: мало где представится возможность запрограммировать оркестратор и контейнерный рантайм для такого масштабного облака.
- В актуальных проектах мы используем свежие решения, например, Java 17 и Python 3.
- Каждый наш релиз уезжает в продакшн и непосредственно влияет на повседневную работу тысяч инженеров Яндекса.
- Спектр задач на любой уровень подготовки, возможность роста, а также возможность принимать решения и участвовать в дизайне и архитектуре сервисов.
Что нужно принять во внимание
- Есть сложные инженерные задачи, но нет ML.
- Как и у многих других инфраструктурных команд, у нас есть дежурства. Мы сами следим за работоспособностью собственного продукта, а также отвечаем на запросы пользователей во внутренней поддержке. Дежурство проходит в рамках рабочего дня. Ночью и по выходным не дежурим, если только ситуация не форс-мажорная.
- Есть legacy, но мы планово работаем над тем, чтобы перестать его использовать.
Вызовы
- Дать инженерам Яндекса «из коробки» окружение, в котором есть всё от мониторинга и отгрузки логов до авторизации и performance-профилирования.
- Поддержка новых сценариев настройки и эксплуатации — автоскейлинг сервисов, построение service mesh на базе своих сервисов и многое другое.
- Повышение прозрачности жизненного цикла сервиса во внутреннем облаке — интеграция с observability-инструментами, таймлайн событий сервиса, дашборды потенциальных проблем.
- Придумать и воплотить в жизнь десятки идей, чтобы ускорить и повысить эффективность использования аппаратных ресурсов.