Лакмус хаос Состояние эксперимента Неудачный этап: не удалось в фазе внедрения хаоса
Я провожу эксперимент cpu-hog на своем модуле и вижу, что его ошибка Fail Step: не удалось на фазе внедрения хаоса. не видя никаких журналов о том, почему это не работает. ценю любую помощь. Кажется, что эксперимент, учетная запись службы и файлы результатов были созданы нормально, однако вердикт показывает, что это не удалось. я не мог поймать журналы, когда работа (бегун) выполнялась.
ссылка: Ямлы экспериментов с ЦП, которые я использую, находятся здесь
k logs litmus-8548bd-skvbt -n litmus
{"level":"info","ts":1607551992.9267251,"logger":"controller_chaosengine","msg":"Reconciling ChaosEngine","Request.Namespace":"sbs-svs","Request.Name":"sbs-abc-server-cpu-hog-chaos"}
{"level":"info","ts":1607551993.3839076,"logger":"controller_chaosengine","msg":"Reconciling ChaosEngine","Request.Namespace":"sbs-svs","Request.Name":"sbs-abc-server-cpu-hog-chaos"}
{"level":"info","ts":1607551993.4021606,"logger":"controller_chaosengine","msg":"Reconciling ChaosEngine","Request.Namespace":"sbs-svs","Request.Name":"sbs-abc-server-cpu-hog-chaos"}
k describe chaosresult sbs-abc-server-cpu-hog-chaos-pod-cpu-hog
Name: sbs-abc-server-cpu-hog-chaos-pod-cpu-hog
Namespace: sbs-svs
Labels: app.kubernetes.io/component=experiment-job
app.kubernetes.io/part-of=litmus
app.kubernetes.io/version=1.9.1
chaosUID=c36498b4-16f8-4b2f-93ca-601d5c72bb56
controller-uid=8a7be18b-8eef-4190-afda-2d24cef0fcbf
job-name=pod-cpu-hog-7iq6o6
name=sbs-abc-server-cpu-hog-chaos-pod-cpu-hog
Annotations: <none>
API Version: litmuschaos.io/v1alpha1
Kind: ChaosResult
Metadata:
Creation Timestamp: 2020-12-09T19:36:46Z
Generation: 2
Managed Fields:
API Version: litmuschaos.io/v1alpha1
Fields Type: FieldsV1
fieldsV1:
f:metadata:
f:labels:
.:
f:app.kubernetes.io/component:
f:app.kubernetes.io/part-of:
f:app.kubernetes.io/version:
f:chaosUID:
f:controller-uid:
f:job-name:
f:name:
f:spec:
.:
f:engine:
f:experiment:
f:status:
.:
f:experimentstatus:
.:
f:failStep:
f:phase:
f:verdict:
Manager: experiments
Operation: Update
Time: 2020-12-09T19:37:50Z
Resource Version: 32768765
Self Link: /apis/litmuschaos.io/v1alpha1/namespaces/sbs-svs/chaosresults/sbs-abc-server-cpu-hog-chaos-pod-cpu-hog
UID: 38b0ad59-e153-4d6a-a099-ee3dad2579df
Spec:
Engine: sbs-abc-server-cpu-hog-chaos
Experiment: pod-cpu-hog
Status:
Experimentstatus:
Fail Step: failed in chaos injection phase
Phase: Completed
Verdict: Fail
Events: <none>
2 ответа
Команда "Убить контейнер" работала некорректно для моего дистрибутива. У меня сработала следующая команда. Обновлена переменная env в движке yaml
- name: CHAOS_KILL_COMMAND
value: "kill $(find /proc -name exe -lname '*/md5sum' 2>&1 | grep -v 'Permission denied' | awk -F/ '{print $(NF-1)}' | head -n 1)"
Используйте команду, чтобы просмотреть журналы для экспериментального модуля:
k logs -f pod <pod-name> -n litmus
Для более подробной информации: См.