Pasar al contenido principal
Logo GMV

Main navigation

  • Sectores
    • Icono espacio
      Espacio
    • Icono Aeronáutica
      Aeronáutica
    • Icono Defensa y Seguridad
      Defensa y seguridad
    • Icono Sistemas Inteligentes de Transporte
      Sistemas inteligentes de transporte
    • Icono Automoción
      Automoción
    • Icono Ciberseguridad
      Ciberseguridad
    • Icono Servicios públicos Digitales
      Servicios públicos digitales
    • Icono Sanidad
      Sanidad
    • Icono Industria
      Industria
    • Icono Financiero
      Financiero
    • Icono Industria
      Servicios
    • Todos los sectores

    Destacamos

    Visual Language Models
    Visual Language Models: cuando los robots entienden su entorno
  • Talento
  • Sobre GMV
    • Conoce la empresa
    • Historia
    • Equipo directivo
    • Certificaciones
    • Sostenibilidad
  • Comunicación
    • Noticias
    • Eventos
    • Blog
    • Revista GMV News
    • Sala de prensa
    • Biblioteca de medios
    • Actualidad GMV

Secondary navigation

  • Productos A-Z
  • GMV Global
    • Global (en)
    • España y LATAM (es - ca - en)
    • Alemania (de - en)
    • Portugal (pt - en)
    • Polonia (pl - en)
    • Todas las sedes y los sites de GMV
  • Inicio
Atrás
Nueva búsqueda
Date
Blog
  • Automatización

Visual Language Models: cuando los robots entienden su entorno

06/02/2026
  • Imprimir
Compartir
Visual Language Models

Uno de los principales desafíos de la robótica industrial avanzada no reside únicamente en la capacidad de captar información del entorno, sino en interpretarla de forma coherente y contextual. Ver no es comprender. Para que un robot pueda operar de manera autónoma y fiable en entornos reales, debe ser capaz de integrar datos procedentes de múltiples fuentes —cámaras, sensores de proximidad, LiDAR, micrófonos u otros sistemas— y transformarlos en conocimiento accionable en tiempo real.

Tradicionalmente, la visión artificial se ha basado en modelos especializados, entrenados para tareas concretas y con un alto grado de dependencia de datos etiquetados y escenarios controlados. Si bien estos enfoques han demostrado su eficacia en contextos industriales bien definidos, presentan limitaciones claras cuando se enfrentan a entornos dinámicos, variabilidad operativa o situaciones no previstas durante el entrenamiento.

En este contexto, los Visual Language Models (VLM) están suponiendo un cambio de paradigma. Estos modelos combinan capacidades de visión por computador y procesamiento del lenguaje natural en una arquitectura unificada, lo que les permite asociar elementos visuales con conceptos lingüísticos de alto nivel. El resultado es una comprensión más rica del entorno, basada no solo en patrones visuales, sino también en semántica, contexto y relaciones entre objetos y acciones.

Desde un punto de vista técnico, los VLM permiten generalizar mejor entre dominios, reducir la necesidad de entrenamiento específico para cada caso de uso y facilitar la transferencia de conocimiento entre escenarios distintos. Modelos de este tipo, ampliamente estudiados, han demostrado una notable capacidad para razonar sobre imágenes a partir de descripciones en lenguaje natural, y viceversa.

En GMV, estas capacidades se están trasladando al ámbito operativo mediante su integración en el marketplace de uPathWay, la plataforma inteligente para la gestión, orquestación y optimización de flotas heterogéneas de robots y vehículos autónomos en entornos industriales. La incorporación de VLM abre la puerta a nuevos escenarios de interacción y supervisión, aportando una capa adicional de inteligencia contextual sobre la percepción clásica.

Entre los casos de uso que se están habilitando destacan:

  • Supervisión de robots mediante lenguaje natural apoyado en información visual, facilitando una interacción humano–robot más intuitiva y reduciendo la barrera técnica para operadores y supervisores.
  • Generación automática de descripciones del estado operativo o de incidencias, a partir de imágenes o secuencias de vídeo captadas por los propios robots.
  • Validación visual de tareas, como la comprobación automática de que una carga, un pallet o un elemento inspeccionado se encuentra correctamente posicionado o en el estado esperado.
  • Detección de anomalías basada en contexto, identificando situaciones inesperadas que no estaban explícitamente definidas en reglas o modelos previos.
  • Interfaces más naturales y flexibles, que combinan prompts en lenguaje natural con información visual del entorno para apoyar la toma de decisiones.

Estas capacidades contribuyen a una robótica más autónoma, explicable y escalable, capaz de adaptarse a entornos industriales complejos, cambiantes y con un alto grado de incertidumbre. Más allá de la automatización de tareas, los VLM permiten avanzar hacia sistemas que no solo ejecutan, sino que también interpretan y comunican lo que ocurre a su alrededor.

GMV continúa trabajando en la integración de percepción avanzada e inteligencia contextual como habilitadores clave de la automatización industrial del futuro, con el objetivo de acercar estas tecnologías desde el ámbito de la investigación a aplicaciones reales y operativas.

Autor: Ángel C. Lázaro

  • Imprimir
Compartir

Comentarios

Acerca de formatos de texto

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.
CAPTCHA
Esta pregunta es para comprobar si usted es un visitante humano y prevenir envíos de spam automatizado.

Relacionados

uPathWay
  • Automatización
Cuando los robots aprenden a hablar el mismo idioma: la nueva era de la interoperabilidad industrial

Contacto

Isaac Newton, 11 Tres Cantos
E-28760 Madrid

Tel. +34 91 807 21 00

Contact menu

  • Contacto
  • GMV en el mundo

Blog

  • Blog

Sectores

Sectors menu

  • Espacio
  • Aeronáutica
  • Defensa y Seguridad
  • Sistemas Inteligentes de Transporte
  • Automoción
  • Ciberseguridad
  • Servicios públicos digitales
  • Sanidad
  • Industria
  • Financiero
  • Servicios
  • Talento
  • Sobre GMV
  • Directo a
    • Sala de prensa
    • Noticias
    • Blog
    • Productos A-Z
© 2026, GMV Innovating Solutions S.L.

Footer menu

  • Contacto
  • Aviso legal
  • Política de privacidad
  • Política de cookies

Footer Info

  • Compromiso Medioambiental
  • Información financiera