Код на окружениях работает за счет конвейеров CI/CD. DevOps-инженеры выстраивают такие конвейеры, используя специализированные инструменты и подходы – Azure DevOps Server, Gitlab CI, BitBucket, Jenkins, Github Actions и др.
DevOps-инженеры помогают создать окружения, на которых будет работать код программного продукта. Благодаря DevOps все обновления происходят автоматически благодаря заранее подготовленным скриптам, и сводится к минимуму ручная работа при выкладке кода на окружение, благодаря чему уменьшается количество ошибок, а процесс восстановления продукта после аварий происходит быстро и безболезненно.
Код на окружениях работает за счет конвейеров CI/CD. DevOps-инженеры выстраивают такие конвейеры, используя специализированные инструменты и подходы – Azure DevOps Server, Gitlab CI, BitBucket, Jenkins, Github Actions и др.
Инфраструктура бывает трех типов:
Разворачивается обвязка либо вручную, либо через конфигураторы, такие, как Ansible, ArgoCD, Terraform.
Примеры наших Best Practices:
И многие другие проверки
Это мониторинг, который отслеживает работоспособность инфраструктуры на уровне виртуальных машин и сервисов.
Ключевые инструменты
Это инфраструктурные метрики продукта внутри кластера – как и метрики самого кластера, так и отдельно продукта.
Ключевые инструменты
В этом случае мы отслеживаем процессы и сервисы. По сути, это выполнение разработанной системой SLA по его продуктовым метрикам.
Для примера – время выполнения запросов.
Это KPI, т.е. главная панель, которую активно смотрит бизнес-заказчик.
Траблшутинг – поиск и устранение неявных ошибок и неточностей.
Выкатка новых микросервисов – продукт развивается, появляется дополнительная функциональность и интеграции. Это требует дополнительных настроек, а, бывает, в какой-то момент и перестройки инфраструктуры решения.
Дополнительные требования со стороны заказчика - подключаются специалисты на стороне заказчика и формируют дополнительные требования. Перед стартом эксплуатации продукта мы дополнительно фокусируемся на безопасности – например, заворачиваем трафик на Web Application Firewall (WAF), настраиваем лимиты на ресурсы и подключения.
Дежурства. В случае возникновения проблем срабатывает алертинг и приходит звонок на телефон дежурного инженера. В зависимости от сложности проблемы разбираются сами или подключаются инженеры заказчика и наша команда разработки.
Обработка обращений и инцидентов. С вопросами, просьбами и проблемами по конвейерам, окружениям и всем остальным обращаются к DevOps-инженерам.
В зависимости от задачи это может быть оценка того:
Disaster and recovery plan – это отработанная и протестированная процедура, нацеленная на восстановление работоспособности решения с нуля в четкие целевые сроки (кусочек SLA по предоставлению сервиса). В зависимости от требований DRP может включать в себя различные инструменты, обучение и тренировку специалистов заказчика, регулярные автоматические или ручные процедуры и т.д.