AI Aprendeu Independentemente A Jogar Xadrez Em Um Nível Sobre-humano Em Um Dia - Visão Alternativa

AI Aprendeu Independentemente A Jogar Xadrez Em Um Nível Sobre-humano Em Um Dia - Visão Alternativa
AI Aprendeu Independentemente A Jogar Xadrez Em Um Nível Sobre-humano Em Um Dia - Visão Alternativa

Vídeo: AI Aprendeu Independentemente A Jogar Xadrez Em Um Nível Sobre-humano Em Um Dia - Visão Alternativa

Vídeo: AI Aprendeu Independentemente A Jogar Xadrez Em Um Nível Sobre-humano Em Um Dia - Visão Alternativa
Vídeo: As 3 armadilhas de Bobby Fischer! 2024, Abril
Anonim

O algoritmo AlphaZero, sem um professor humano, dominou o xadrez e o jogo de shogi em 24 horas para vencer outros programas campeões que antes derrotavam pessoas incondicionalmente.

Deep Mind, uma empresa que desenvolve algoritmos para inteligência artificial (IA), publicou dados sobre os resultados do retreinamento do algoritmo AlphaGo para jogar xadrez e shogi. Anteriormente, AlphaGo era capaz de vencer os campeões mundiais no game of go. A inteligência artificial conseguiu dominar novos jogos ainda mais rápido. O trabalho correspondente é postado no servidor de pré-impressão da Cornell University.

AlphaZero usou um método de aprendizagem por reforço. É um subtipo de aprendizado de máquina profundo que não usa um professor humano, mas exclusivamente jogos entre duas IAs. Embora no início ambos os AIs joguem muito fracamente, devido à sua alta velocidade (em comparação com um professor humano) eles podem jogar um grande número de jogos em um curto período de tempo e selecionar movimentos comprovados e suas sequências em certas posições no tabuleiro, o que dá a capacidade dos algoritmos de aumentar seu nível com extrema rapidez.

Neste caso, AlphaZero atingiu um nível de jogo superior ao de qualquer jogador humano em apenas 24 horas. Então ela foi autorizada a jogar com Stockfish, o melhor jogador de xadrez disponível, e Elmo, o melhor jogador de shogi (um jogo de xadrez altamente modificado no início da Idade Média no Japão).

Apesar de um período de treinamento muito curto, AlphaZero venceu Stockfish 28 vezes e empatou mais 72 vezes. Conseguiu vencer o Elmo 90 vezes, perder 8 vezes e empatar 2 vezes. Esses são resultados extraordinariamente altos. Tanto o xadrez quanto o shogi são muito diferentes do go para o qual AlphaGo foi originalmente criado, bem como um do outro. Por exemplo, "xadrez japonês" implica possibilidades extremamente exóticas, como jogar qualquer uma das peças "comidas" do inimigo. A vitória de um algoritmo criado para Go apenas por jogar com um algoritmo completamente idêntico significa que um professor humano pode alcançar

IVAN ORTEGA

Recomendado: