Apesar do progresso significativo feito recentemente, os sistemas de visão de máquina estão muito atrás de seus equivalentes biológicos. Isso se aplica não apenas à velocidade de processamento da informação, mas também à confiabilidade. O fato é que o cérebro é capaz de reconhecer objetos, independentemente de qual parte dele esteja visível no momento. E às vezes até com base no contexto geral. Foi assim que a IA foi ensinada por especialistas americanos.
Cientistas da Universidade da Califórnia em Los Angeles e da Universidade de Stanford são responsáveis pelo desenvolvimento, e seu sistema pode ver o mundo ao seu redor graças ao mesmo método que usamos. De acordo com a redação dos Anais da Academia Nacional de Ciências, o sistema pode identificar objetos com base apenas em algumas de suas partes, que antes não estavam disponíveis para nenhuma IA.
O próprio processo de aprendizagem de um novo método consiste em três etapas sucessivas. Depois que o sistema é solicitado a encontrar um objeto, ele divide a imagem em pedaços menores. A figura acima mostra como o sistema identifica um objeto com base apenas nessas pequenas partes. Em seguida, cada parte é analisada separadamente e suas conexões com outros objetos do quadro geral são identificadas. Depois disso, a IA novamente "olha" para a imagem inteira e identifica quais partes da imagem estão relacionadas ao objeto original e quais não estão. Bem, então a IA começou a treinar em inúmeras fotos e vídeos tirados da rede.
No estágio final, os cientistas testaram o sistema em mais de 9.000 imagens de pessoas e vários objetos e, em todos os casos, reconheceu o que era necessário, pelo menos não pior do que uma IA com vasta experiência, mas treinada pelo "antigo" método.
Vladimir Kuznetsov