Дмитрий Рыбалка — 4 способа выявления сбоев узла в Kubernetes: возвращение рабочей нагрузки
Ближайшая конференция — DevOops 2025, даты будут анонсированы позднее.
Подробности и билеты: https://jrg.su/t1mP5U
— —
Скачать презентацию с сайта DevOops — https://jrg.su/1ckiNC
Выход из строя рабочего узла кластера Kubernetes — всегда непредсказуемое событие, влекущее за собой различные влияния на рабочую нагрузку.
Спикер рассказал, как сделать такие ситуации не просто менее стрессовыми, но и максимально управляемыми.
Дмитрий рассмотрел:
— Как Kubernetes обнаруживает сбои узлов. Что вы можете сделать для того, чтобы улучшить этот процесс.
— Node-problem-detector (NPD) и возможности его кастомизации.
— Альтернативы NPD: их сильные и слабые стороны.
— Стратегии планирования размещения нагрузки с учетом доменов отказа с целью минимизировать аффект.