A Rede Neural Aprendeu A Gerar Vídeos Com Base Na Descrição De - Visão Alternativa

A Rede Neural Aprendeu A Gerar Vídeos Com Base Na Descrição De - Visão Alternativa
A Rede Neural Aprendeu A Gerar Vídeos Com Base Na Descrição De - Visão Alternativa

Vídeo: A Rede Neural Aprendeu A Gerar Vídeos Com Base Na Descrição De - Visão Alternativa

Vídeo: A Rede Neural Aprendeu A Gerar Vídeos Com Base Na Descrição De - Visão Alternativa
Vídeo: 3 técnicas indicadas por cientistas para qualquer pessoa melhorar nos estudos 2024, Pode
Anonim

A inteligência artificial cria vídeos com roteiro - até agora curtos e borrados, mas um dia ela sozinha substituirá um estúdio de cinema inteiro.

As redes neurais já são muito boas (e em muitos casos melhores do que as pessoas) no reconhecimento de padrões em uma imagem e são capazes de descrever em termos gerais cenas inteiras. As redes neurais gerativas realizam a transformação reversa e podem formar uma imagem com base em sua descrição ou prever o próximo quadro com base nos anteriores.

Os desenvolvedores belgas foram ainda mais longe, combinando esses recursos em um único sistema que cria vídeos "do nada", com base em sua própria experiência de aprendizado de máquina e texto de script. Tinne Tuytelaars falou sobre isso em uma reunião da Associação para o Avanço da Inteligência Artificial (AAAI) realizada nos Estados Unidos.

A rede neural funciona em dois estágios - segundo Tinne, como se imitasse o processo criativo de uma pessoa: no primeiro estágio, um "esboço" borrado e aproximado de cada quadro é formado, após o qual detalhes são especificados e adicionados. Uma das partes importantes de tal sistema é uma rede neural discriminatória, que compara o resultado com vídeos "reais" que se enquadram em um determinado cenário e permite avaliar sua qualidade, melhorando o trabalho da parte geradora do sistema.

A rede neural foi treinada em 10 cenas ("jogando golfe na grama", "kitesurf no mar" etc.) e aprendeu a separar ações e circunstâncias umas das outras, podendo também combiná-las de qualquer forma, criando vídeos, por exemplo, sobre "Golfe na piscina":

Image
Image

ou "velejando na neve":

Image
Image

Vídeo promocional:

Claro, a qualidade de tais animações ainda está longe de ser aceitável: "vídeos" com duração de cerca de um segundo consistem em apenas 32 quadros com dimensões de 64x64 pixels.

Mas com a mesma confiança é possível garantir que esses números vão melhorar rapidamente, porque não faz muito tempo o próprio cinema só podia se orgulhar de uma imagem turva, contorcida e muda. Se tal rede neural puder ser feita realmente rápida e eficiente, Hollywood pode chegar ao fim: bastará pegar o roteiro e o filme está pronto. Esta oportunidade será útil na geração de grandes conjuntos para treinar outras redes neurais e na criação de novos algoritmos para compactar e transmitir streaming de vídeo.

Sergey Vasiliev

Recomendado: