Stateful-приложения в Swarm

TL;DR: Stateful в Swarm: constraint на конкретную ноду + named volume + 1 реплика. Для серьёзных баз — managed DB (RDS) лучше, чем Swarm.

Stateful приложения (БД) сложнее stateless, так как данные лежат на диске конкретной ноды.

Стратегия 1: Привязка к ноде (Pinning)

Жестко привяжите сервис к конкретной ноде, где лежат данные.

services:
  db:
    image: postgres
    volumes:
      - /opt/data/pg:/var/lib/postgresql/data
    deploy:
      replicas: 1
      placement:
        constraints: [node.hostname == node-1]

Плюс: Простота, максимальная скорость диска (I/O).
Минус: Если node-1 сгорит, сервис не переедет, пока вы не восстановите данные на другой ноде.

Стратегия 2: Сетевые хранилища (NFS / Cloud Volumes)

Используйте драйверы томов, которые монтируют сетевые диски.

volumes:
  db-data:
    driver: local
    driver_opts:
      type: nfs
      o: addr=192.168.1.100,rw
      device: ":/path/to/nfs/share"

Плюс: Сервис может переехать на любую ноду, данные “едут” за ним.
Минус: Задержки сети, сложность настройки NFS/GlusterFS/Ceph.

Типичные ошибки

Ошибка	Симптом	Решение
БД с `replicas: 2`	Два инстанса пишут в разные volumes — split brain	`replicas: 1` + constraint на одну ноду
Volume на другой ноде	БД рестартовала на воркере без данных	Constraint привязывает к ноде с volume
Нет бэкапа volume	Нода упала — данные потеряны	Регулярный `pg_dump` + внешнее хранилище
`global` mode для БД	БД на каждой ноде	`replicated` с 1 репликой для stateful

Knowladge Base

Проводник

Запуск Stateful-приложений (БД)

Stateful-приложения в Swarm

Стратегия 1: Привязка к ноде (Pinning)

Стратегия 2: Сетевые хранилища (NFS / Cloud Volumes)

Типичные ошибки

Вид графа

Оглавление

Обратные ссылки