Inteligência Artificial Híbrida (doravante denominada AI) e um novo conjunto de dados e benchmarks para avaliar as capacidades dos algoritmos de AI em raciocinar sobre as ações contidas nas informações de vídeo foram apresentados por pesquisadores da IBM, MIT, Harvard e DeepMind na conferência ICLR 2020, TheNextweb relata em 17 de maio.
O novo conjunto de dados e ambiente de pesquisa apresentado no ICLR 2020 é denominado CoLlision Events for Video REpresentation and Reasoning ou CLEVRER. Eles são baseados no CLEVR, um conjunto de perguntas e respostas visuais desenvolvido na Universidade de Stanford em 2017. CLEVR é um conjunto de tarefas que representam imagens estáticas de objetos sólidos. O agente de IA deve ser capaz de analisar a cena e responder a várias perguntas sobre o número de objetos, seus atributos e suas relações espaciais.
Como solução para uma difícil tarefa da IA clássica, os pesquisadores apresentaram um modelo de pensamento dinâmico neuro-simbólico, uma combinação de redes neurais e inteligência artificial simbólica.
Os resultados mostraram que a incorporação de redes neurais e programas simbólicos em um modelo de IA pode combinar seus pontos fortes e superar seus pontos fracos. "A representação simbólica fornece uma estrutura comum poderosa para visão, linguagem, dinâmica e causalidade", observam os autores, acrescentando que os programas simbólicos permitem ao modelo "capturar explicitamente a composicionalidade subjacente à estrutura causal do vídeo e a lógica da questão."
As vantagens de tais sistemas são limitadas por desvantagens incondicionais. Os dados usados para treinar o modelo requerem anotações adicionais, o que pode consumir muita energia e ser caro em aplicativos do mundo real.