As 5 principais notícias sobre IA que você perdeu esta semana: atualizações do ChatGPT e as últimas ações do Google

Esta semana tivemos várias surpresas de empresas de IA que não estavam em evidência. Parece que Gêmeos do Google A caminho de se tornar um favorito dos fãs, enquanto Grok Ele lidera a lista dos chatbots de melhor desempenho. Um novo modelo de IA médica ajuda médicos a detectar mais de 1000 doenças, incluindo câncer.

Enquanto isso, o ChatGPT está tomando medidas agressivas para aumentar a segurança entre seus usuários mais jovens, introduzindo proteções para usuários menores de 18 anos. Aqui estão as principais notícias sobre IA que você precisa saber esta semana.

Gemini é o favorito do público entre 27 modelos diferentes de IA.

Num dos maiores inquéritos públicos do género, mais de 21000 participantes nos EUA e no Reino Unido avaliaram 27 modelos de IA diferentes – e Gêmeos 2.5 Pró No topo da lista. O estudo, conduzido com o sistema Humaine da Prolific, avaliou modelos com base em critérios como estilo de comunicação, capacidade de inferência, nível de confiança e experiência geral do usuário.

O Gemini superou seus concorrentes, incluindo ChatGPT e Claude, na maioria das subcategorias, consolidando sua posição como o modelo de inferência mais avançado do Google até o momento. O ChatGPT ficou em oitavo lugar na classificação geral.

Pontos principais:

Gemini 2.5 Pro fica em primeiro lugar Em uma pesquisa de opinião pública com 27 modelos nos EUA e no Reino Unido.
21,352 pessoas compartilharam De diferentes grupos demográficos nestes resultados.
Critérios de avaliação: Comunicação, flexibilidade, raciocínio, confiança e experiência geral do usuário.
ChatGPT classificado em oitavo No geral, os lançamentos de Claude ficaram em 11º e 12º lugar.

ChatGPT cria recursos específicos para adolescentes

Finalmente, o OpenAI é lançado Novas regras de segurança para adolescentesAs atualizações incluem um sistema de previsão de idade para detectar usuários menores de 18 anos, com cautela, aplicando controles preventivos caso a idade seja desconhecida. As promessas incluem filtros mais rigorosos para tópicos sensíveis (conteúdo sexual, automutilação, etc.), bem como controles parentais, como bloqueio de horários e a capacidade de vincular contas.

Essas mudanças são apenas o começo, mas levantam questões difíceis sobre como a idade será definida, com que frequência os erros afetarão a confiança e se os adolescentes se sentirão seguros para se abrir caso tenham medo de ser observados ou julgados.

o que saber

Nova regra para detecção de idadeA OpenAI direcionará os usuários que ela determinar serem menores de 18 anos para uma versão do ChatGPT com regras de segurança mais rígidas.
Padrão para menores de idadeSe a idade não puder ser confirmada, o sistema toma precauções aplicando pequenas restrições de qualquer maneira.
Fornecendo ferramentas de controle parentalOs pais podem se conectar à conta do adolescente, desabilitar ou restringir recursos (como memória ou histórico), definir horários seguros (bloquear horários) e receber alertas se a IA detectar sinais de sofrimento.
Restrições de bate-papo para adolescentesConteúdo sexual explícito, bate-papos de flerte e discussões sobre automutilação são restritos. Em casos extremos de dano iminente, a polícia poderá ser contatada caso os pais não possam ser contatados.

Agora você pode compartilhar suas criações personalizadas do Gemini.

O Google está expandindo o alcance do Gemini, agora oferecendo aos usuários a capacidade de compartilhar seus assistentes personalizados, os Gems. Para aqueles mais familiarizados com o ChatGPT, estes são essencialmente Modelos GPT personalizadosAntes era Gemas de Gêmeos Limitado ao uso pessoal e privado, agora ele pode ser compartilhado tão facilmente quanto o Google Docs, permitindo que colegas, alunos e qualquer outra pessoa colaborem com uma IA personalizada, sem precisar criá-la do zero.

Essa mudança ressalta o esforço do Google para tornar o Gemini uma plataforma mais flexível e fácil de usar.

O que você precisa saber:

Gemas personalizáveis Eles são assistentes com tecnologia de IA que você pode criar para tarefas específicas, como programação, edição ou brainstorming.
As joias são compartilhadas Assim como ao compartilhar qualquer outra coisa no Google Drive, quando você colabora, outras pessoas podem visualizar ou editar seu Gem.
Agora disponível para assinantes Gemini Advanced, Business e Enterprise em mais de 150 países.

Grok lidera lista ARC-AGI

Elon Musk e a Grok 4 parecem estar liderando a corrida da IA, liderando a lista ARC-AGI, um benchmark que mede o número de problemas que uma IA pode resolver e a eficiência de um modelo. Em testes recentes, a Grok 4 superou concorrentes como ChatGPT e Gemini nessa métrica desafiadora, destacando sua capacidade superior de resolver problemas do mundo real e sua velocidade.

Apesar de sua velocidade, uso de pesquisa na web ao vivo e tratamento impressionante de alegações complexas de engenharia, os usuários ainda têm preocupações sobre a precisão, moderação de conteúdo e viés do Grok.

O que você precisa saber:

Lista ARC-AGI TopO Grok 4 afirma estar classificado em primeiro lugar, o que significa que ele resolve mais desafios de IA padrão por unidade de recurso do que os concorrentes.
ponto de força: Pesquisa na web praticamente instantânea, melhor manuseio de tarefas geométricas e lógicas complexas e melhorias de desempenho em comparação com versões anteriores do Grok.
Fraquezas e medos
: Problemas com a precisão do conteúdo (algumas alegações incorretas), problemas de parcialidade e o desafio de manter a moderação e a confiabilidade sob uso intenso.
Conclusão:Isso demonstra que eficiência e qualidade são cada vez mais recompensadas em benchmarks de IA.

Um novo modelo de IA prevê o risco de mais de 1000 doenças, incluindo câncer.

Um novo modelo de IA chamado Delphi-2M representa um salto quântico na IA médica. Treinado com dados de saúde anônimos de quase 2.3 milhões de pessoas no Reino Unido e na Dinamarca, ele consegue prever o risco de desenvolver mais de 1000 doenças e estimar quando elas podem ocorrer.

Ao contrário de outros modelos de IA, o Delphi-2M fornece uma pontuação de risco para 1000 casos, utilizando históricos de doenças, fatores de estilo de vida, idade e gênero para simular trajetórias de saúde ao longo de décadas. O modelo consegue prever não apenas qual doença pode ocorrer, mas também quando.

Em experimentos, o sistema alcançou uma área sob a curva (AUC) média de 0.76 em centenas de doenças em conjuntos de dados do Reino Unido, embora a precisão tenha diminuído em populações dinamarquesas. É importante ressaltar que este modelo não é uma ferramenta de diagnóstico e não substitui médicos humanos.

Mas a ferramenta é promissora como uma ferramenta preditiva, útil para monitorar tendências gerais de risco, planejar a prevenção e destacar o potencial da IA na saúde pessoal.

Pontos principais:

enorme conjunto de dados:Treinado com quase 2.3 milhões de pessoas do Biobanco do Reino Unido + registros dinamarqueses.
Modelagem abrangente e temporalEle usa informações detalhadas (idade, sexo, estilo de vida, diagnósticos anteriores) e prevê a próxima doença e as seguintes: ومتى Isso vai acontecer.
Previsão, não diagnóstico:O objetivo é orientar a prevenção, não substituir o aconselhamento médico.

Conclusão

Em apenas uma semana, essas atualizações destacam uma mudança clara no cenário da IA em direção à integração com o mundo real e avanços maiores.