Passar para o conteúdo principal
Logo GMV

Main navigation

  • Setores
    • Icono espacio
      Espaço
    • Icono Aeronáutica
      Aeronáutica
    • Icono Defensa y Seguridad
      Defesa e segurança
    • Icono Sistemas Inteligentes de Transporte
      Sistemas inteligentes de transporte
    • Icono Automoción
      Setor Automóvel
    • Icono Ciberseguridad
      Cibersegurança
    • Icono Servicios públicos Digitales
      Serviços públicos digitais
    • Icono Sanidad
      Saúde
    • Icono Industria
      Indústria
    • Icono Financiero
      Financeiro
    • Icono Industria
      Serviços
    • Todos os setores

    Em destaque

    Visual Language Models
    Visual Language Models: quando os robôs entendem o seu ambiente
  • Talento
  • Sobre a GMV
    • Conheça a empresa
    • História
    • Equipa executiva
    • Certificações
    • Sustentabilidade
  • Comunicação
    • Notícias
    • Eventos
    • Blogue
    • Revista GMV News
    • Sala de imprensa
    • Biblioteca de meios
    • Atualidade GMV

Secondary navigation

  • Produtos A-Z
  • GMV Global
    • Global (en)
    • Espanha e América Latina (es - ca - en)
    • Alemanha (de - en)
    • Portugal (pt - en)
    • Polónia (pl - en)
    • Todas as sedes e locais da GMV
  • Início
Para trás
New search
Date
Blog
  • Automatização

Visual Language Models: quando os robôs entendem o seu ambiente

06/02/2026
  • Imprimir
Partilhar
Visual Language Models

Um dos principais desafios da robótica industrial avançada não reside apenas na capacidade de captar informações do ambiente, mas sobretudo em interpretá-las de forma coerente e contextualizada. Ver não é compreender. Para que um robô possa operar de forma autónoma e fiável em ambientes reais, deve ser capaz de integrar dados provenientes de múltiplas fontes — câmaras, sensores de proximidade, LiDAR, microfones ou outros sistemas – e convertê-los em conhecimento acionável, em tempo real.

Tradicionalmente, a visão artificial tem assentado em modelos especializados, treinados para tarefas específicas e fortemente dependentes de dados etiquetados e cenários controlados. Embora estas abordagens tenham demonstrado eficácia em contextos industriais bem definidos, apresentam claras limitações quando confrontadas com ambientes dinâmicos, variabilidade operacional ou situações não previstas durante a fase de treino.

Neste contexto, os Visual Language Models (VLM) representam uma verdadeira mudança de paradigma. Estes modelos combinam capacidades de visão computacional e de processamento de linguagem natural numa arquitetura unificada, o que lhes permite associar elementos visuais a conceitos linguísticos de alto nível. O resultado é uma compreensão mais rica do ambiente, baseada não apenas em padrões visuais, mas também em semântica, contexto e nas relações entre objetos e ações.

Do ponto de vista técnico, os VLM permitem uma melhor generalização entre domínios, reduzem a necessidade de treino específico para cada caso de uso e facilitam a transferência de conhecimento entre diferentes cenários. Modelos desta natureza, amplamente estudados, têm demonstrado uma notável capacidade de raciocinar sobre imagens a partir de descrições em linguagem natural e vice-versa.

Na GMV, estas capacidades estão a ser transferidas para o domínio operacional através da sua integração no marketplace da uPathWay, a plataforma inteligente para a gestão, orquestração e otimização de frotas heterogéneas de robôs e veículos autónomos em ambientes industriais. A incorporação dos VLM abre a porta a novos cenários de interação e monitorização, acrescentando uma camada adicional de inteligência contextual aos sistemas clássicos de perceção.

Entre os casos de uso atualmente em implementação destacam-se:

  • Supervisão de robôs através de linguagem natural apoiada em informações visuais, facilitando uma interação humano-robô mais intuitiva e reduzindo a barreira técnica para operadores e supervisores.
  • Geração automática de descrições do estado operacional ou de incidentes, a partir de imagens ou sequências de vídeo capturadas pelos próprios robôs.
  • Validação visual de tarefas, incluindo a verificação automática de que uma carga, palete ou elemento inspecionado está corretamente posicionado ou no estado esperado.
  • Deteção de anomalias contextualizada, identificando situações inesperadas que não estavam explicitamente definidas em regras ou modelos anteriores.
  • Interfaces mais naturais e flexíveis, que combinam prompts em linguagem natural com informações visuais do ambiente para apoiar a tomada de decisões.

Estas capacidades contribuem para uma robótica mais autónoma, explicável e escalável, capaz de se adaptar a ambientes industriais complexos, dinâmicos e com um elevado grau de incerteza. Para além da automação de tarefas, os VLM permitem evoluir para sistemas que não apenas executam ações, mas também interpretam e comunicam o que acontece ao seu redor.

A GMV continua a aposta na integração de perceção avançada e inteligência contextual como fatores-chave da automação industrial do futuro, com o objetivo de transferir estas tecnologias do domínio da investigação para aplicações reais e operacionais.

Autor: Ángel C. Lázaro

  • Imprimir
Partilhar

Comentários

Sobre os formatos de texto

Texto simples

  • Não são permitidas etiquetas de HTML.
  • As linhas e os parágrafos quebram automaticamente.
  • Endereços de páginas Web e de e-mail transformam-se automaticamente em ligações.
CAPTCHA
Esta questão é para testar se você é um visitante humano ou não a fim de prevenir submissões automáticas de spam.

Related

uPathWay
  • Automatização
Quando os robôs aprendem a falar o mesmo idioma: a nova era da interoperabilidade industrial

Contacte-nos

Alameda dos Oceanos, 115
1990-392 Lisboa, Portugal

Tel. +351 308801495
Fax. +351 213866493

Contact menu

  • Contacte-nos
  • A GMV no mundo

Blog

  • Blog

Setores

Sectors menu

  • Espaço
  • Aeronáutica
  • Defesa e Segurança
  • Sistemas Inteligentes de Transporte
  • Setor Automóvel
  • Cibersegurança
  • Serviços públicos digitais
  • Saúde
  • Indústria
  • Financeiro
  • Serviços
  • Talento
  • Sobre a GMV
  • Direto a
    • Sala de imprensa
    • Notícias
    • Blogue
    • Produtos A-Z
© 2026, GMV Innovating Solutions S.L.

Footer menu

  • Contactos
  • Aviso legal
  • Política de privacidade
  • Política de cookies

Footer Info

  • Compromisso ambiental
  • Informação financeira