As 5 principais notícias sobre IA que você perdeu esta semana: atualizações do ChatGPT e as últimas ações do Google

Esta semana tivemos várias surpresas de empresas de IA que não estavam em evidência. Parece que Gêmeos do Google A caminho de se tornar um favorito dos fãs, enquanto Grok Ele lidera a lista dos chatbots de melhor desempenho. Um novo modelo de IA médica ajuda médicos a detectar mais de 1000 doenças, incluindo câncer.

Inteligência artificial (IA) e um cérebro brilhante ao lado da tela de um smartphone

Enquanto isso, o ChatGPT está tomando medidas agressivas para aumentar a segurança entre seus usuários mais jovens, introduzindo proteções para usuários menores de 18 anos. Aqui estão as principais notícias sobre IA que você precisa saber esta semana.

Gemini é o favorito do público entre 27 modelos diferentes de IA.

Logotipo do Gemini em um smartphone com o logotipo do Google atrás

Num dos maiores inquéritos públicos do género, mais de 21000 participantes nos EUA e no Reino Unido avaliaram 27 modelos de IA diferentes – e Gêmeos 2.5 Pró No topo da lista. O estudo, conduzido com o sistema Humaine da Prolific, avaliou modelos com base em critérios como estilo de comunicação, capacidade de inferência, nível de confiança e experiência geral do usuário.

O Gemini superou seus concorrentes, incluindo ChatGPT e Claude, na maioria das subcategorias, consolidando sua posição como o modelo de inferência mais avançado do Google até o momento. O ChatGPT ficou em oitavo lugar na classificação geral.

Pontos principais:

  • Gemini 2.5 Pro fica em primeiro lugar Em uma pesquisa de opinião pública com 27 modelos nos EUA e no Reino Unido.
  • 21,352 pessoas compartilharam De diferentes grupos demográficos nestes resultados.
  • Critérios de avaliação: Comunicação, flexibilidade, raciocínio, confiança e experiência geral do usuário.
  • ChatGPT classificado em oitavo No geral, os lançamentos de Claude ficaram em 11º e 12º lugar.

ChatGPT cria recursos específicos para adolescentes

OpenAI

Finalmente, o OpenAI é lançado Novas regras de segurança para adolescentesAs atualizações incluem um sistema de previsão de idade para detectar usuários menores de 18 anos, com cautela, aplicando controles preventivos caso a idade seja desconhecida. As promessas incluem filtros mais rigorosos para tópicos sensíveis (conteúdo sexual, automutilação, etc.), bem como controles parentais, como bloqueio de horários e a capacidade de vincular contas.

Essas mudanças são apenas o começo, mas levantam questões difíceis sobre como a idade será definida, com que frequência os erros afetarão a confiança e se os adolescentes se sentirão seguros para se abrir caso tenham medo de ser observados ou julgados.

o que saber

  • Nova regra para detecção de idadeA OpenAI direcionará os usuários que ela determinar serem menores de 18 anos para uma versão do ChatGPT com regras de segurança mais rígidas.
  • Padrão para menores de idadeSe a idade não puder ser confirmada, o sistema toma precauções aplicando pequenas restrições de qualquer maneira.
  • Fornecendo ferramentas de controle parentalOs pais podem se conectar à conta do adolescente, desabilitar ou restringir recursos (como memória ou histórico), definir horários seguros (bloquear horários) e receber alertas se a IA detectar sinais de sofrimento.
  •  Restrições de bate-papo para adolescentesConteúdo sexual explícito, bate-papos de flerte e discussões sobre automutilação são restritos. Em casos extremos de dano iminente, a polícia poderá ser contatada caso os pais não possam ser contatados.

Agora você pode compartilhar suas criações personalizadas do Gemini.

Introdução às joias de Gêmeos

O Google está expandindo o alcance do Gemini, agora oferecendo aos usuários a capacidade de compartilhar seus assistentes personalizados, os Gems. Para aqueles mais familiarizados com o ChatGPT, estes são essencialmente Modelos GPT personalizadosAntes era Gemas de Gêmeos Limitado ao uso pessoal e privado, agora ele pode ser compartilhado tão facilmente quanto o Google Docs, permitindo que colegas, alunos e qualquer outra pessoa colaborem com uma IA personalizada, sem precisar criá-la do zero.

Essa mudança ressalta o esforço do Google para tornar o Gemini uma plataforma mais flexível e fácil de usar.

O que você precisa saber:

  • Gemas personalizáveis Eles são assistentes com tecnologia de IA que você pode criar para tarefas específicas, como programação, edição ou brainstorming.
  • As joias são compartilhadas Assim como ao compartilhar qualquer outra coisa no Google Drive, quando você colabora, outras pessoas podem visualizar ou editar seu Gem.
  • Agora disponível para assinantes Gemini Advanced, Business e Enterprise em mais de 150 países.

Grok lidera lista ARC-AGI

Grok

Elon Musk e a Grok 4 parecem estar liderando a corrida da IA, liderando a lista ARC-AGI, um benchmark que mede o número de problemas que uma IA pode resolver e a eficiência de um modelo. Em testes recentes, a Grok 4 superou concorrentes como ChatGPT e Gemini nessa métrica desafiadora, destacando sua capacidade superior de resolver problemas do mundo real e sua velocidade.

Apesar de sua velocidade, uso de pesquisa na web ao vivo e tratamento impressionante de alegações complexas de engenharia, os usuários ainda têm preocupações sobre a precisão, moderação de conteúdo e viés do Grok.

O que você precisa saber:

  • Lista ARC-AGI TopO Grok 4 afirma estar classificado em primeiro lugar, o que significa que ele resolve mais desafios de IA padrão por unidade de recurso do que os concorrentes.
  • ponto de força: Pesquisa na web praticamente instantânea, melhor manuseio de tarefas geométricas e lógicas complexas e melhorias de desempenho em comparação com versões anteriores do Grok.
  • Fraquezas e medos
    : Problemas com a precisão do conteúdo (algumas alegações incorretas), problemas de parcialidade e o desafio de manter a moderação e a confiabilidade sob uso intenso.
  • Conclusão:Isso demonstra que eficiência e qualidade são cada vez mais recompensadas em benchmarks de IA.

Um novo modelo de IA prevê o risco de mais de 1000 doenças, incluindo câncer.

Imagem gerada por IA de um médico examinando vírus

Um novo modelo de IA chamado Delphi-2M representa um salto quântico na IA médica. Treinado com dados de saúde anônimos de quase 2.3 milhões de pessoas no Reino Unido e na Dinamarca, ele consegue prever o risco de desenvolver mais de 1000 doenças e estimar quando elas podem ocorrer.

Ao contrário de outros modelos de IA, o Delphi-2M fornece uma pontuação de risco para 1000 casos, utilizando históricos de doenças, fatores de estilo de vida, idade e gênero para simular trajetórias de saúde ao longo de décadas. O modelo consegue prever não apenas qual doença pode ocorrer, mas também quando.

Em experimentos, o sistema alcançou uma área sob a curva (AUC) média de 0.76 em centenas de doenças em conjuntos de dados do Reino Unido, embora a precisão tenha diminuído em populações dinamarquesas. É importante ressaltar que este modelo não é uma ferramenta de diagnóstico e não substitui médicos humanos.

Mas a ferramenta é promissora como uma ferramenta preditiva, útil para monitorar tendências gerais de risco, planejar a prevenção e destacar o potencial da IA ​​na saúde pessoal.

Pontos principais:

  • enorme conjunto de dados:Treinado com quase 2.3 milhões de pessoas do Biobanco do Reino Unido + registros dinamarqueses.
  • Modelagem abrangente e temporalEle usa informações detalhadas (idade, sexo, estilo de vida, diagnósticos anteriores) e prevê a próxima doença e as seguintes: ومتى Isso vai acontecer.
  • Previsão, não diagnóstico:O objetivo é orientar a prevenção, não substituir o aconselhamento médico.

Conclusão

Em apenas uma semana, essas atualizações destacam uma mudança clara no cenário da IA ​​em direção à integração com o mundo real e avanços maiores.

Comentários estão fechados.