Diferente do Image.sys (classificação), aqui a imagem bruta não basta: o modelo precisa saber
onde o objeto está. Por isso o pipeline ganha uma etapa nova, a anotação.
Comece criando as classes na barra lateral e enviando as imagens. Dica: fotografe o objeto em posições,
tamanhos e fundos variados, senão o modelo aprende a posição e não o objeto.
Selecione a classe, depois clique e arraste sobre a imagem para desenhar a caixa
ao redor do objeto. A caixa é salva normalizada como (cx, cy, w, h) em relação ao tamanho
da imagem, o mesmo princípio do formato YOLO. Desenhar de novo substitui a caixa. Use ← e → do teclado
para navegar entre imagens.
🏷️ Classe da caixa
🎞️ Imagens
Usamos transfer learning: o backbone MobileNet (treinado no ImageNet) fica
congelado e extrai um mapa de características 7×7×256. Só a cabeça é treinada,
e ela tem duas saídas simultâneas: uma softmax para a classe e quatro neurônios
sigmoid para a caixa (cx, cy, w, h). A perda total combina as duas tarefas:
L = CE(classe) + λ · MSE(caixa). O λ controla quanto o erro de posição pesa frente ao erro de classe.
Fluxo do modelo
Resumo da configuração
| Backbone | MobileNet v1 (α 0.25, 224) |
| Parâmetros do backbone | congelados |
| Cabeça | Flatten → Dropout 0.3 → Dense 128 |
| Saída de classe | - |
| Saída de caixa | 4 (cx, cy, w, h) |
| Perda | CE + λ·MSE |
| Otimizador | Adam |
| Imagens anotadas | 0 |
Acompanhe as duas perdas separadamente: se a perda de classe cai mas a de caixa estagna, aumente o λ. O gráfico da direita mostra o IoU médio na validação por época: IoU (Intersection over Union) mede a sobreposição entre a caixa prevista e a anotada, de 0 a 1. Acima de 0.5 já se considera uma detecção aceitável.
Perdas por época
Validação: IoU médio e acurácia de classe
Uma detecção correta exige duas coisas ao mesmo tempo: classe certa e IoU ≥ 0.5. É por isso que detectores reportam métricas como AP@0.5. Abaixo, a caixa tracejada branca é a anotação (ground truth) e a caixa colorida é a previsão.
Matriz de confusão (classe)
Relatório por classe
| Classe | N | Acerto classe | IoU médio | Det @0.5 |
|---|
Inspeção visual: anotação × previsão
Envie imagens que o modelo nunca viu. Repare nos casos de erro: objeto muito menor do que nos exemplos de treino, fundo diferente, mais de um objeto na cena (o localizador só prevê uma caixa, e tende a apontar para um meio termo). Esses erros motivam exatamente as ideias de grade e âncoras do YOLO.
ou clique para selecionar