Описание тега sre
Site Reliability Engineering (SRE), a reliability focused implementation of DevOps.
2
ответа
DevOps против SRE или DevOps и SRE
Это тот случай, когда SRE - это всего лишь одна реализация DevOps, или, может быть, лучшая реализация DevOps. ИЛИ ЖЕ SRE больше связано с системной инженерией и производственной средой, а DevOps - это практика для автоматизации и упрощения групп раз…
30 окт '18 в 21:49
0
ответов
Как мы измеряем доступность сайта?
Следует ли учитывать зависимости для измерения доступности веб-сайта / API? Например, предположим, что платежный сервис не работает; но торговый сайт все еще доступен. Здесь клиент не может завершить покупку, так как оплата не производится. Влияет л…
27 мар '19 в 03:39
0
ответов
Отчет о соответствии SLO согласно книге Google SRE
Я хочу создать отчет о соответствии SLO, как в справочнике Google SRE, указанном здесь: https://landing.google.com/sre/workbook/chapters/implementing-slos/ Как показано в описании: числа в скобках указывают количество достигнутых целей и общее колич…
05 авг '19 в 21:59
0
ответов
Как и где узнать инженерный курс по надежности сайта?
Может ли кто-нибудь помочь мне, где и как пройти курс обучения надежности сайта, я не получаю правильные ссылки где-либо. я перебрал эти ссылки % 2Flearn% 2Fsite-надежность-инженерно-SLOS & USG = AOvVaw0inAMNS40toLzK5HFFzC3o https://www.google.com/u…
26 июл '19 в 09:48
1
ответ
Новое в DevOps и CI / CD
Как я уже сказал в названии, я новичок в DevOps и CI/CD. У меня нет большого опыта (за исключением онлайн-руководств), и я собираюсь начать проект (ничего особенного), который будет использовать автоматизированные конвейеры CI /CD для всех микросерв…
23 фев '20 в 02:20
0
ответов
Как запускать задачи rake в продакшене вне Ruby on Rails
В Ruby on Rails встроены rake-задачи. Он позволяет запускать фрагмент кода, предназначенный для выполнения только один раз. Как вы это делаете в других средах / языках? Как исправить некоторые элементы базы данных, которые были повреждены из-за ошиб…
20 авг '20 в 23:14
1
ответ
Что подразумевается под мониторингом на основе симптомов и мониторингом на основе причин?
В контексте SRE, что подразумевается под мониторингом на основе симптомов и причин? почему это так важно? И какие инструменты используются для такого мониторинга?
05 сен '20 в 09:02
1
ответ
Создайте конвейер Jenkins через CLI Jenkinsfile
Есть ли способ создать конвейер через командную строку, например: jenkins-cli create pipeline --host <host_url> --jenkinsfile <jenkinfile> Или, может быть, плагин terraform или пакет python. Это можно сделать с помощью облачной информаци…
20 дек '19 в 19:30
1
ответ
каковы лучшие практики для развертывания новых функций для приложения с весенней загрузкой?
У меня есть приложение с весенней загрузкой со слишком большим количеством пользователей, и в мое приложение поступает много входящих запросов. Что мне делать, чтобы развернуть новую функцию в приложении без потери входящего пользовательского запрос…
14 апр '20 в 09:04
1
ответ
Бюджет ошибки записи окна обслуживания
Есть ли бюджет ошибки записи окна обслуживания? Пример. Допустим, у меня остался 1 час ошибки. Останавливаю сервис на плановое обслуживание на 30 минут. Бюджет ошибки по-прежнему составляет 1 час или 30 минут? Окно обслуживания происходит, когда к п…
26 май '20 в 23:50
1
ответ
управлять доступом к кластеру dataproc с помощью служебной учетной записи и ролей IAM
Я новичок в облаке и хотел бы ограничить свои dataproc cluster доступ к заданному gcs buckets в моем проекте. Допустим, я создал service account названный как 'data-proc-service-account@my-cloud-project.iam.gserviceaccount.com'а затем я создаю класт…
29 июл '20 в 04:33
0
ответов
Можно ли избежать передачи сломанного кода в систему без тестов, кроме производственных?
В настоящее время я работаю над серверной частью веб-системы без тестовой среды. Поэтому, когда я запускаю что-то в производство и происходит сбой, я должен вернуться к предыдущей ревизии и зафиксировать ее на кончике основной ветки, фактически оста…
02 окт '20 в 03:25
0
ответов
рецепт от шеф-повара для проверки количества процессов и отслеживания количества дескрипторов открытых файлов
Я пытаюсь обновить metricbeat_cookbook чтобы получить необходимую информацию. Отслеживайте количество сеансов и клиентских процессов html5, запускающих каждый сервер. ps -ef | grep -i html5 | wc -l. Это логика, которая мне нужна в кулинарной книге /…
10 фев '21 в 08:56
1
ответ
выражение предупреждения prometheus для 99% доступности rest API
Я хотел бы создать предупреждение в Prometheus для REST API, если API недоступен в 99% случаев. Я новичок в выражении Прометея. Не могли бы вы помочь мне создать выражение для срабатывания этого ОПОВЕЩЕНИЯ. Например, если у меня есть счетчик failed_…
22 мар '21 в 07:23
0
ответов
Запрос Prometheus для расчета общего количества запросов с задержкой менее 1 с
Это мой SLO, 99,5% успешных запросов (без ответов с 500 ошибками) с задержкой менее 1200 мс. Мне нужно написать правило оповещения. Логика - это количество ответов, отличных от 500, с задержкой <1200 мс, деленное на общее количество запросов. При…
13 апр '21 в 06:58
0
ответов
python psutil против linux top
Я хочу, чтобы загрузка процессора была в секундах. я использую psutil.cpu_percent(1) Это работает, но я обнаружил, что результат отличается от использования в top. Почему это произошло и какой из них является реальной загрузкой процессора? Большое с…
14 апр '21 в 18:51
2
ответа
Правила Prometheus - проверьте количество файлов в каталоге контейнера приложения
Я хочу написать правило Прометея, чтобы постоянно проверять длину очереди сообщений (почтовый ретранслятор exim), которая представляет собой общее количество файлов в каталоге в контейнере приложения, и предупреждать канал о резерве через диспетчер …
09 апр '21 в 15:17
0
ответов
Нужен ли мне полный опыт или опыт веб-разработки, чтобы стать хорошим DevOps-инженером?
Недавно я прошел стажировку в DevOps Engineering Department. Я получил образование в области разработки программного обеспечения, однако в течение всего периода стажировки мне не приходилось писать код. Мои ежедневные задачи включали настройку конве…
28 апр '21 в 01:33
1
ответ
вложенный оператор if else в файл gitlab -ci
если [ ! -f "$ (pwd) / Dockerfile"]; затем cp $ (pwd) / internal-helms / core-engine / Dockerfile. elif [! -f "$ (pwd) /psparser.py"]; затем cp $ (pwd) /internal-helms/core-engine/psparser.py.; fi
06 май '21 в 15:43
1
ответ
Сканирование контейнера Anchore в Jenkins CI Pipeline
Мне нужна помощь с моим файлом CI Jenkinsfile. Код в Jenknsfile выглядит так: pipeline { environment { registry = "user/demo1" registryCredential = 'dockerhub' dockerImage = '' } agent any stages { stage('Building image') { steps{ script { dockerIma…
05 май '21 в 13:44