# HEARTBEAT.md - CloudFarm Health Monitor

## Checklist de Monitoramento

Execute estas verificações a cada heartbeat. Se encontrar problemas, envie alerta pro grupo.

### 1. Backend CloudFarm
```bash
# Verificar se processo está rodando
pm2 status cloudfarm-api 2>/dev/null | grep -E "online|stopped|error"

# Verificar logs de erro recentes (últimos 5 min)
pm2 logs cloudfarm-api --lines 50 --nostream 2>/dev/null | grep -iE "error|exception|fatal|crash" | tail -5
```

### 2. MongoDB
```bash
# Verificar conexão
mongosh --eval "db.adminCommand('ping')" --quiet 2>/dev/null || echo "MongoDB: FALHA"
```

### 3. Erros 5xx nos logs
```bash
# Contar erros HTTP 5xx recentes
pm2 logs cloudfarm-api --lines 200 --nostream 2>/dev/null | grep -E "status.*5[0-9]{2}|HTTP 5" | wc -l
```

## Critérios de Alerta

| Condição | Ação |
|----------|------|
| Processo stopped/error | 🚨 Alerta CRÍTICO |
| Erros 5xx > 5 em 5min | ⚠️ Alerta WARNING |
| Exceptions nos logs | 📋 Reportar resumo |
| Tudo OK | HEARTBEAT_OK |

## Formato do Alerta

Se encontrar problema:
```
🔒 *OpSec Health Check*

⚠️ *Status*: [CRÍTICO/WARNING]
📍 *Sistema*: CloudFarm Backend
🕐 *Horário*: [timestamp]

💥 *Problema*:
[descrição]

🔧 *Ação sugerida*:
[recomendação]
```

## Notas

- Não alerte para erros já conhecidos/esperados
- Agrupe múltiplos erros similares
- Se tudo estiver OK, responda apenas: HEARTBEAT_OK