Modelos de IA: capacidades tremendas, mas insuficientes na indústria de videogames

À medida que as ferramentas de IA evoluem, somos constantemente incentivados a delegar tarefas complexas a elas. Grandes modelos de linguagem podemLLMs) Escrever nossos e-mails, criar apresentações, projetar aplicativos, criar vídeos, pesquisar na internet e resumir descobertas e muito mais. No entanto, uma coisa com a qual ainda tenho muita dificuldade são os videogames.

Até agora neste ano, duas das maiores empresas de IA (Microsoft e Anthropic) tentaram fazer com que seus modelos criassem ou jogassem, e os resultados são provavelmente muito mais limitados do que muitas pessoas esperam. Isso destaca os desafios atuais na IA generativa, especialmente em tarefas que exigem planejamento estratégico de longo prazo e tomada de decisões complexas.

Isso os torna demonstrações perfeitas do que a IA generativa realmente é capaz de fazer agora – em resumo: ela pode fazer muito mais do que antes, mas não pode fazer tudo. Isso reflete que a IA generativa ainda está em estágio de desenvolvimento e que, apesar de suas capacidades crescentes, ainda enfrenta limitações em algumas áreas.

Microsoft produz Quake II com inteligência artificial

A produção de videogames enfrenta desafios semelhantes aos encontrados na produção de vídeo, onde o movimento é estranho e distorcido, e a inteligência artificial começa a perder o contato com a “realidade” após um certo período de tempo. A mais recente tentativa da Microsoft, que Qualquer um pode tentar.É uma versão gerada por IA de Quake II.

Joguei o jogo várias vezes e é uma experiência muito estranha, com inimigos desorientadores aparecendo do nada e o ambiente ao seu redor mudando conforme você se move. Muitas vezes, quando eu entrava em uma nova sala, a porta desaparecia quando eu me virava para encará-la, e quando eu olhava para frente novamente, as paredes tinham se movido.

A experiência dura apenas alguns minutos antes de parar e solicitar que você inicie um novo jogo, mas se você não tiver sorte, o jogo pode parar de responder corretamente às suas entradas antes mesmo disso.

No entanto, é uma ótima experiência e acho que seria benéfico se mais pessoas a vissem. Ele permite que você experimente por si mesmo o que a IA generativa faz de bom e quais são as limitações atuais. Embora seja impressionante que tenhamos conseguido criar uma experiência de videogame interativa, é difícil imaginar que alguém possa jogar esta demonstração tecnológica e acreditar que o próximo Assassin's Creed será produzido por IA.

No entanto, esses tipos de ideias e suposições existem, em grande parte porque as pessoas não conseguem deixar de ouvir falar sobre IA agora. Mesmo que você não se importe nem um pouco com a IA, ela ainda será imposta a você onde quer que vá. O problema é que as informações que uma pessoa comum recebe consistem quase inteiramente em comentários de marketing de grandes empresas de tecnologia e comentários de executivos coletados por publicações de notícias.

Isso significa que eles ouvem afirmações exageradas e conflitantes como estas:

Tem o potencial de resolver alguns dos maiores problemas do mundo, como mudanças climáticas, pobreza e doenças. (Bill Gates)

É provável que em 2025, nós da Meta, assim como outras empresas que estão trabalhando principalmente nisso, tenhamos uma IA que possa atuar como seu engenheiro de nível médio na empresa e possa escrever código com eficiência. (Mark Zuckerberg)

O uso eficaz da IA agora é uma expectativa básica para todos na Shopify. É uma ferramenta para todas as profissões hoje em dia e se tornará ainda mais importante com o passar do tempo. Francamente, não acho que seja possível evitar aprender a aplicar IA no seu negócio. (Toby Lutke, CEO da Shopify)

Agora estamos confiantes de que sabemos como construir inteligência artificial geral (AGI) como tradicionalmente a entendemos. Acreditamos que em 2025 poderemos ver os primeiros agentes de IA “se juntarem à força de trabalho” e mudarem fundamentalmente a forma como as empresas produzem. (Sam Altman, CEO da OpenAI)

A inteligência artificial é mais perigosa do que, digamos, projetos de aeronaves mal administrados, manutenção de produção deficiente ou produção de carros de má qualidade, no sentido de que ela tem o potencial — ainda que pequeno, mas não trivial — de destruir a civilização. (Elon Musk)

Isso tudo parece um pouco demais, não é? Ele deve nos salvar e nos destruir ao mesmo tempo, ser uma ferramenta para profissionais e uma ferramenta que irá substituí-los - e parece que poderemos ter uma IA de nível de ficção científica ainda neste ano. Quando as pessoas ouvem tudo isso, elas começam a esperar coisas incríveis desses aparelhos e acreditam que todos os trabalhadores de escritório passam os dias conversando com seus computadores como personagens de Star Trek.

Contudo, a realidade não é bem assim. A realidade parece o Quake II, trêmula e borrada, com formas inimigas ininteligíveis. Os modelos LLM de nível ChatGPT já foram um avanço empolgante em 2022 e muito divertidos para todos brincarem, mas para a maioria dos usos que as grandes empresas de tecnologia estão nos impondo agora, a IA simplesmente não é capaz o suficiente. Os níveis de precisão são muito baixos, as habilidades de seguir instruções são muito baixas, os intervalos de contexto são muito pequenos e eles são treinados apenas com base em jargões da internet e não em conhecimento do mundo real.

Mas criar um videogame é uma meta extremamente complexa: afinal, equipes inteiras de humanos levam anos para fazer essas coisas. Que tal jogar videogame em vez disso?

Claude "joga" Pokémon Red

Bem, parece que as pessoas também estão experimentando nessa área. O mais recente modelo da Anthropic, que é Soneto de Cláudio 3.7 , Ele joga Pokémon Red na Twitch Ele já existe há cerca de dois meses e tem feito o melhor trabalho que um grande modelo de linguagem (LLM) já fez ao jogar Pokémon. No entanto, há uma pequena ressalva: ele ainda está muito atrás do nível médio de uma criança humana de 10 anos.

Um problema é a velocidade: Claude realiza milhares de ações ao longo de vários dias para fazer coisas como atravessar a Floresta Viridiana. Isso reflete os desafios da IA ao lidar com tarefas complexas.

Por que demora tanto? Não é que ele não consiga descobrir como vencer batalhas Pokémon estrategicamente — na verdade, é nisso que ele é bom. Por outro lado, navegar pelo ambiente e evitar árvores e edifícios não é tão bom. Claude nunca foi treinado para jogar Pokémon, e não é fácil para ele entender pixel art e o que ela representa. Essas dificuldades destacam a lacuna entre a capacidade de processar dados e a capacidade de interagir com ambientes complexos.

Passar por áreas labirínticas como o Monte Moon é particularmente difícil para ele, pois ele luta para formar um mapa da área e evitar ser retraçado. Certa vez, ele ficou tão preso em um canto que concluiu que o jogo estava quebrado e emitiu um pedido oficial para reiniciá-lo. Isso ilustra como a IA, apesar de suas capacidades avançadas, ainda carece da compreensão intuitiva que os humanos possuem.

Essas primeiras tentativas também tiveram seus momentos engraçados.

Certa vez, Claude ficou encurralado e, convencido de que algo estava errado, escreveu uma solicitação formal para reiniciar o jogo. foto.twitter.com/5RIiCJdxCM— Antrópica (@AnthropicAI) 25 de fevereiro de 2025

Ele também não é bom em lembrar de seus objetivos, coisas que já tentou ou lugares que já visitou.

Há uma razão muito simples para isso: modelos de linguagem grandes (LLMs) têm uma "janela de contexto" limitada que atua como sua memória. Eles só podem armazenar uma certa quantidade de informações e, quando Claude atinge o limite, ele comprime o que tem para abrir espaço para mais. Assim, uma informação como "visitou a Cidade de Viridian, entrou em todos os prédios e falou com todos os NPCs" pode ser comprimida para apenas "visitou a Cidade de Viridian" – levando Claude a voltar e verificar se há algo Plus para fazer na cidade.

Resumindo: Claude não consegue descobrir para onde está indo, bate nas paredes, fica confuso com objetos aleatórios e NPCs, esquece onde esteve e o que está tentando fazer, e cada decisão que toma exige parágrafos e parágrafos de reflexão. Isto não é uma crítica – são experimentos interessantes que levam os grandes modelos de linguagem (LLMs) aos limites do que é possível.

Mas com todo esse entusiasmo em torno da IA, é importante que as pessoas vejam demonstrações como essa e formem suas próprias opiniões sobre ela. Algumas pessoas estão tentando vender a ideia de que estamos prestes a atingir o pico da inteligência — que dentro de alguns anos, a inteligência artificial (IA) ultrapassará até mesmo os humanos mais inteligentes — mas não acho que estejam sendo honestas, são apenas vendedores. Não estamos nem perto do pico, tudo isso está apenas começando.