¿Qué es SAM 3?

SAM 3 (Segment Anything Model 3) es un modelo de inteligencia artificial desarrollado por Meta para detectar, segmentar y rastrear objetos en imágenes y videos utilizando texto, imágenes de ejemplo o indicaciones visuales. 

Es la evolución de SAM y SAM 2. (AI Meta)

¿Qué significa "segmentar"?

Segmentar consiste en identificar exactamente qué píxeles pertenecen a un objeto. 

Por ejemplo, si tienes una fotografía de un partido de fútbol de robots, SAM 3 puede separar:

  • Cada robot.

  • La pelota.

  • Las porterías.

  • Las líneas del campo.

Y generar una máscara precisa para cada elemento. 

(AI Meta)

Novedades de SAM 3

A diferencia de versiones anteriores, SAM 3 puede trabajar con conceptos descritos por texto:

  • "robot azul"

  • "pelota naranja"

  • "todos los jugadores"

  • "personas con casco"

El modelo encuentra todas las instancias que coincidan con esa descripción dentro de una imagen o video. 

(Hugging Face)

Aplicaciones en robótica

Para proyectos de robótica como los que desarrollas, SAM 3 puede utilizarse para:

  • Visión artificial avanzada.

  • Seguimiento de robots en una cancha.

  • Detección automática de obstáculos.

  • Etiquetado automático de imágenes para entrenar modelos YOLO.

  • Reconstrucción 3D de objetos a partir de imágenes. 

    (Acerca de Facebook)

Ejemplo práctico

Imagina una fotografía de una competencia de Robótica Soccer.

Le indicas:

"Detecta todos los robots azules"

SAM 3 generará una máscara para cada robot azul encontrado.

Luego puedes pedir:

"Sigue esos robots en el video"

y SAM 3 los rastreará cuadro por cuadro. 

(Ultralytics Docs)

Comparación rápida

ModeloImágenesVideoTexto
SAM
SAM 2Limitado
SAM 3✅ Avanzado

(Acerca de Facebook)

Si tu interés es la robótica soccer, puedo explicarte cómo combinar SAM 3 + YOLO + OpenCV + ROS 2 para detectar robots, balón y porterías en tiempo real.

Comentarios