Agora você pode enviar e editar fotos no Gemini.

Resumo:

Agora você pode enviar e editar fotos no Gemini gratuitamente. Esse recurso está sendo implementado gradualmente para todos os usuários, a partir de hoje.
Os usuários também podem criar e editar imagens de IA no Gemini por meio de prompts de texto conversacionais.
O Google confirma que todas as imagens geradas por IA no Gemini terão uma marca d'água visível e uma marca d'água digital SynthID invisível.

Por fim, o Google está introduzindo a capacidade de editar fotos no Gemini por meio de prompts de texto. Agora você pode enviar e editar fotos existentes no Gemini por meio de bate-papos de texto. Além disso, você pode criar imagens de IA com o Gemini e duplicá-las para modificar a imagem. O recurso de edição de fotos do Gemini está sendo implementado gradualmente para todos os usuários, a partir de hoje. Este novo recurso aprimora a experiência do usuário e fornece ferramentas criativas poderosas.

O Google foi o primeiro a oferecer edição nativa de imagens usando o modelo Gemini 2.0 Flash no AI Studio. Testei o modelo em fevereiro e fiquei surpreso com a facilidade de editar imagens de forma conversacional. Em resposta ao modelo nativo de geração de imagens do Google, a OpenAI também introduziu a edição e geração de imagens nativas no ChatGPT.

Isso levou a Tendência Ghibli O que se espalhou muito rapidamente e aumentou o uso do ChatGPT. Agora, o Google trouxe a edição nativa de fotos para seu aplicativo Gemini para o consumidor. Observe que você pode editar fotos tanto no aplicativo móvel Gemini quanto na web. Esse recurso torna o Gemini um forte concorrente no campo da IA generativa.

Desde que eu comparei Edição de imagem nativa entre ChatGPT e GeminiPosso dizer que Gêmeos é muito melhor em manter a consistência de personagens/cenas ao longo das gerações. O ChatGPT muda o cenário geral após cada geração, enquanto o Gemini é muito consistente. No entanto, para geração de imagens, o ChatGPT supera o Gemini. Isso reflete diferenças na estrutura dos modelos usados.

Agora precisamos saber se o Google ainda está usando o modelo baseado em difusão do Imagen 3 para gerar imagens ou usando os recursos nativos de geração de imagens dos modelos Gemini. A propósito, o OpenAI usa o modelo de IA GPT-4o para criar e modificar imagens. Este desenvolvimento ilustra a competição contínua no campo da inteligência artificial.

Além disso, o Google diz que uma marca d'água digital invisível SynthID é incorporada em todas as imagens criadas ou editadas com o Gemini. Além disso, o Google também adicionará uma marca d'água visível a todas as imagens criadas com o Gemini. Esta medida visa aumentar a transparência e a responsabilização no uso da inteligência artificial.

Gemini