Imagens realistas e texto legível com os modelos de IA mais recentes da OpenAI. Experimente gratuitamente.

A OpenAI incorporou seu modelo 4o ao ChatGPT para permitir a geração de imagens nativamente no ambiente do chatbot. Esta atualização elimina a necessidade de usar o modelo de geração de imagens Dall-E da OpenAI como uma entidade separada, embora o Dall-E ainda esteja disponível para aqueles que preferirem. A empresa de IA também habilitou seu gerador de vídeo Sora AI dentro do ChatGPT. 

Imagem gerada pela OpenAI - Uma foto espontânea, no estilo paparazzi, de Karl Marx caminhando apressadamente pelo estacionamento do Mall of America.

Os novos recursos estão atualmente disponíveis para usuários gratuitos do ChatGPT, bem como para usuários do ChatGPT Plus, Team e Pro. Esses recursos estarão disponíveis para usuários empresariais e educacionais na próxima semana.

Dall-E 3 era anteriormente o plugin de geração de imagens para assinantes pagos do ChatGPT. Enquanto isso, quem quiser testar o gerador gratuitamente pode fazê-lo através da versão básica do Microsoft Copilot. 

O modelo foi elogiado como um dos melhores geradores de imagens disponíveis, especialmente em sua versão paga. Embora seja benéfico para todos os usuários do ChatGPT poderem usar a geração de imagens integrada ao modelo 4o, aqueles que usam a versão gratuita do ChatGPT devem estar preparados para enfrentar algumas limitações, como limites de upload de arquivos e análise de dados, conforme observado. CNET

No entanto, o ChatGPT se beneficiará de imagens mais realistas com texto mais claro depois que a OpenAI passou um ano treinando o GPT-4o após o lançamento por meio de um esforço de treinamento chamado “Aprendizagem por Reforço do Feedback Humano” (RLHF), de acordo com Wall Street Journal

Após anunciar o GPT-4o em maio de 2024, a OpenAI teve uma equipe de mais de 100 “treinadores humanos” examinando o modelo em busca de erros de digitação, bem como erros comuns em mãos e rostos, disse o pesquisador-chefe do projeto, Gabriel Goh, ao jornal.

O modelo GPT-4o também adicionará a capacidade de criar fundos transparentes ao ChatGPT. Espera-se que isso seja muito útil para usuários corporativos e criativos, pois permitirá que eles criem logotipos ou outros ícones, como Jackie Shannon, chefe de produtos multimídia da ChatGPT, observou ao WSJ. 

Apesar das melhorias feitas pela OpenAI, o modelo GPT-4o atualizado como um todo ainda apresenta algumas deficiências. Ele ainda tem uma tendência a alucinações, uma característica comum em IA que ainda não foi resolvida. Manter a consistência editorial continua sendo um desafio no ambiente ChatGPT; No entanto, Eu prometi OpenAI com atualizações rápidas, já na semana que vem. 

Outro problema atual enfrentado pela OpenAI é a questão da ética e da legitimidade. A empresa insiste que seu modelo foi treinado com "dados disponíveis publicamente", bem como dados proprietários que ela possui por meio de parcerias com marcas como a Shutterstock, observou o WSJ. 

Imagens geradas pelo ChatGPT com base no modelo 4o não conterão marcas d'água de IA. No entanto, a empresa observou que as imagens incluirão metadados C2PA, indicando que foram geradas por IA. Este continua sendo o padrão da indústria.

Comentários estão fechados.