¿Qué es SAM 3?

SAM 3 (Segment Anything Model 3) es un modelo de inteligencia artificial desarrollado por Meta para detectar, segmentar y rastrear objetos en imágenes y videos utilizando texto, imágenes de ejemplo o indicaciones visuales.

Es la evolución de SAM y SAM 2. (AI Meta)

¿Qué significa "segmentar"?

Segmentar consiste en identificar exactamente qué píxeles pertenecen a un objeto.

Por ejemplo, si tienes una fotografía de un partido de fútbol de robots, SAM 3 puede separar:

Cada robot.
La pelota.
Las porterías.
Las líneas del campo.

Y generar una máscara precisa para cada elemento.

(AI Meta)

Novedades de SAM 3

A diferencia de versiones anteriores, SAM 3 puede trabajar con conceptos descritos por texto:

"robot azul"
"pelota naranja"
"todos los jugadores"
"personas con casco"

El modelo encuentra todas las instancias que coincidan con esa descripción dentro de una imagen o video.

(Hugging Face)

Aplicaciones en robótica

Para proyectos de robótica como los que desarrollas, SAM 3 puede utilizarse para:

Visión artificial avanzada.
Seguimiento de robots en una cancha.
Detección automática de obstáculos.
Etiquetado automático de imágenes para entrenar modelos YOLO.
Reconstrucción 3D de objetos a partir de imágenes.
(Acerca de Facebook)

Ejemplo práctico

Imagina una fotografía de una competencia de Robótica Soccer.

Le indicas:

"Detecta todos los robots azules"

SAM 3 generará una máscara para cada robot azul encontrado.

Luego puedes pedir:

"Sigue esos robots en el video"

y SAM 3 los rastreará cuadro por cuadro.

(Ultralytics Docs)

Comparación rápida

Modelo	Imágenes	Video	Texto
SAM	✅	❌	❌
SAM 2	✅	✅	Limitado
SAM 3	✅	✅	✅ Avanzado

(Acerca de Facebook)

Si tu interés es la robótica soccer SAM3 puede servirte para detectar robots, balón y porterías en tiempo real.

https://github.com/facebookresearch/sam3

IA ROBOTXYZ

Buscar este blog