DevOps и инфраструктура

DevOps-инженеры помогают создать окружения, на которых будет работать код программного продукта. Благодаря DevOps все обновления происходят автоматически благодаря заранее подготовленным скриптам, и сводится к минимуму ручная работа при выкладке кода на окружение, благодаря чему уменьшается количество ошибок, а процесс восстановления продукта после аварий происходит быстро и безболезненно.

На каких этапах работы продукта нужен DevOps-инженер?

Разработка
На этапе проектирования архитектуры продукта DevOps-инженер подключается и участвует в продумывании инфраструктуры под необходимости компании.
Код на окружениях работает за счет конвейеров CI/CD. DevOps-инженеры выстраивают такие конвейеры, используя специализированные инструменты и подходы – Azure DevOps Server, Gitlab CI, BitBucket, Jenkins, Github Actions и др.
Инфраструктура бывает трех типов:
On-premises - локальная, развернутая вручную на серверах или виртуальных машинах.
Public Cloud – облачная, такая, как AWS, Яндекс, Сбер, VK и т.д.
Private Cloud – собственные локальные облака.
Для старта разработки DevOps-инженеры создают «обвязку» решения:
Базы данных (MSSQL/PgSQL/Scylla/Cassandra)
Очереди/шины данных (RabbitMQ/Kafka)
Отказоустойчивые кэши (Redis/Hazelcast)
Балансировщики (HaProxy/Nginx)
Хранилище секретов (Vault/LockBox)
Хранилище BLOB (MongoDB/Minio/S3)
Провайдеры авторизации (ADFS/Keycloak/WSO2)
Логирование (ELK/Splunk)
Мониторинги (Zabbix/Prometheus/VictoriaMetriks/Grafana)
Разворачивается обвязка либо вручную, либо через конфигураторы, такие, как Ansible, ArgoCD, Terraform.
Во время выкладки кода DevOps-инженеры проверяют код на соответствие Best Practices и Cloud Native требованиям.
Примеры наших Best Practices:
корректная работа команды разработки с ветками по TBD
проверка, где и каким образом хранятся ключи, сертификаты, конфиги
проверка кода на безопасность
наличие мониторинга/алертинга
И многие другие проверки
Перед выводом в промышленную эксплуатацию настраиваем мониторинги и алертинги.
1. Системный –
Это мониторинг, который отслеживает работоспособность инфраструктуры на уровне виртуальных машин и сервисов.
Ключевые инструменты
2. Технический –
Это инфраструктурные метрики продукта внутри кластера – как и метрики самого кластера, так и отдельно продукта.
Ключевые инструменты
3. Технологический –
В этом случае мы отслеживаем процессы и сервисы. По сути, это выполнение разработанной системой SLA по его продуктовым метрикам.
Для примера – время выполнения запросов.
4. Бизнесовый –
Это KPI, т.е. главная панель, которую активно смотрит бизнес-заказчик.
Эксплуатация
Мы внедрили и провели первоначальную настройку, теперь наступает момент тонкого тюнинга и шлифовки. Инженеры подключаются к следующим видам работ:
Траблшутинг – поиск и устранение неявных ошибок и неточностей.
Выкатка новых микросервисов – продукт развивается, появляется дополнительная функциональность и интеграции. Это требует дополнительных настроек, а, бывает, в какой-то момент и перестройки инфраструктуры решения.
Дополнительные требования со стороны заказчика - подключаются специалисты на стороне заказчика и формируют дополнительные требования. Перед стартом эксплуатации продукта мы дополнительно фокусируемся на безопасности – например, заворачиваем трафик на Web Application Firewall (WAF), настраиваем лимиты на ресурсы и подключения.
Дежурства. В случае возникновения проблем срабатывает алертинг и приходит звонок на телефон дежурного инженера. В зависимости от сложности проблемы разбираются сами или подключаются инженеры заказчика и наша команда разработки.
Обработка обращений и инцидентов. С вопросами, просьбами и проблемами по конвейерам, окружениям и всем остальным обращаются к DevOps-инженерам.
Инфраструктура разработки
Также DevOps-инженеры занимаются сопровождением инфраструктуры для разработки. Среди них:
Кластера Kubernetes
Системы CI/CD - Azure DevOps Server, Gitlab CI
Blob storage - Minio, MongoDB
Базы данных – PgSQL, MSSQL
Системы информационной безопасности - SonarQube, Dependency Track, GitLeaks
Раннеры для сборки как для Linux, так и для Windows
Системы мониторинга – Grafana, Prometheus, VictoriaMetrics, Zabbix
Системы авторизации – ADFS, KeyCloak, WSO2
Очереди, Кэши
Миграции и R&D задачи
Наши заказчики внедряют новые платформы, изменяют свою инфраструктуру и т.д., и это – полноценные миграции. Миграции со старого стека на новый или с одной большой бэк-системы на другую. В этом случае исследовательский характер задачи в том, чтобы сначала полностью проанализировать и описать текущее состояние, работу, взаимосвязи, спроектировать новое во всех аспектах и спланировать переезд. DevOps-инженеры создают инфраструктуру, аналогичную существующей или целевой, и тестируют ее в нужных разрезах.
В зависимости от задачи это может быть оценка того:
как устанавливается и как обновляется,
чем обеспечивается консистентность данных,
надежность,
производительность системы,
какие есть способы переключения,
каким образом влияет таймаут переключение,
какие ошибки выдаются и как решение их обрабатывает,
как ведутся и как должны вестись операции по обслуживанию инфраструктуры и кластера, к примеру, перестраивание индексов либо отключение/подключение новой ноды.
Disaster and recovery plan
Создать решение – одно дело. Другое – сделать его отказоустойчивым и всегда иметь «план Б» восстановления на случай критических ситуаций.
Disaster and recovery plan – это отработанная и протестированная процедура, нацеленная на восстановление работоспособности решения с нуля в четкие целевые сроки (кусочек SLA по предоставлению сервиса). В зависимости от требований DRP может включать в себя различные инструменты, обучение и тренировку специалистов заказчика, регулярные автоматические или ручные процедуры и т.д.

Какие услуги мы предлагаем

Приведение к best practices
Если у вас уже есть инфраструктура, но вы сомневаетесь в уровне безопасности, современности кода или просто хотите сделать всю инфраструктуру единообразной и стандартизованной, то мы поможем навести порядок в соответствии с best practices.
На уровне отдельного приложения
Весь цикл подготовки инфраструктуры для вашего конкретного приложения.
На уровне платформенных сервисов
Поддержка комплекса продуктов на приватных или публичных сервисах, как Yandex Cloud и SberCloud.

или пишите на почту sales@trueengineering.ru