Что такое перцентиль в Observability? Простое объяснение с примерами

Что такое перцентиль в Observability? Когда мы говорим про observability и метрики, особенно задержку (latency), часто встречаются термины p50, p95, p99. Это и есть перцентили. С их помощью можно понять не только среднее время ответа системы, но и то, как она ведёт себя для большинства пользователей — и для тех, кому повезло меньше. Простое определение Перцентиль — это значение, ниже которого укладывается заданный процент измерений. p50 — медиана. Половина запросов быстрее, половина медленнее. p95 — 95% запросов выполняются не хуже этого времени, 5% — хуже. p99 — только 1% запросов хуже этого значения. Зачем нужны перцентили Среднее время ответа часто обманывает. Пример: ...

сентября 25, 2025 · 2 минуты · 1 слово · John Cena

Изменение IP-адресов узлов в Kubernetes: почему это плохая идея и что делать, если пришлось

Изменять IP-адреса узлов в Kubernetes — опасно. Это может привести к нестабильной работе кластера, потере связи между компонентами и невозможности запуска приложений. Разберёмся, почему не стоит менять IP, и как поступить, если всё же пришлось. 1. Почему важен IP-адрес узла Kubernetes использует IP-адреса узлов для: Идентификации узла и его kubelet Связи между компонентами кластера Работы CNI и сетевых плагинов DNS и сервисов Проверки TLS-сертификатов После изменения IP все эти связи рвутся, узел становится NotReady, а поды могут не перезапускаться. ...

сентября 15, 2025 · 2 минуты · 252 слова · DevOps Insights

Распространённые ошибки etcd и как их исправить

Введение etcd — это распределённое хранилище ключ-значение, критически важное для работы Kubernetes. Оно хранит конфигурацию и состояние кластера. Ошибки в etcd могут привести к нестабильности или недоступности кластера. В этой статье мы рассмотрим типичные ошибки etcd, их причины и решения. 1. etcdserver: request timed out ❓ Причина Проблемы с сетью или задержки ввода-вывода на диске между узлами etcd. 🛠️ Решение Проверьте производительность диска: iostat -xz 1 Используйте SSD для хранения etcd. Проверьте сетевую задержку: ping <etcd-member-IP> 2. etcdserver: leader changed ❓ Причина Частая смена лидера указывает на нестабильность кластера. ...

сентября 13, 2025 · 2 минуты · 229 слов · John Cena

Как защититься от DDoS-атак: стратегии для DevOps и разработчиков

DDoS (распределённая атака типа «отказ в обслуживании») — это массовая отправка запросов к вашему сервису с целью перегрузить систему. В статье расскажем, как защищать Kubernetes-кластеры, API и серверы от DDoS — на практике и с примерами. 1. Что такое DDoS-атака? Сеть заражённых устройств (ботнет) начинает массово слать трафик на ваш сервис. Это может: Забить канал (UDP flood) Использовать уязвимость протокола (SYN flood) Ломать API (HTTP flood) 2. Основные методы защиты 🔐 2.1. Ограничение скорости (rate limiting) NGINX-пример: ...

сентября 11, 2025 · 1 минута · 198 слов · DevOps Insights

Обзор Java-фреймворков: что выбрать для проекта

Обзор Java-фреймворков: что выбрать для проекта Java остаётся одним из самых популярных языков, особенно в мире backend-разработки. В этой статье мы рассмотрим ведущие Java-фреймворки и их особенности. Зачем использовать фреймворк? Преимущества: Структура и лучшие практики Снижение шаблонного кода Интеграция DI, конфигураций и тестирования 1. Spring Boot Применение: Enterprise-приложения, микросервисы @SpringBootApplication public class MyApp { public static void main(String[] args) { SpringApplication.run(MyApp.class, args); } } Плюсы: Огромная экосистема Отличная документация Активное сообщество Минусы: ...

сентября 7, 2025 · 2 минуты · 229 слов · John Cena