Segredos de telefone que os entusiastas de IA precisam: levando Gemini e ChatGPT ao máximo

Uma das tendências mais notáveis — e, francamente, mais chatas — na indústria de smartphones nos últimos dois anos tem sido a conversa constante sobre experiências de IA. As empresas de silício, em particular, frequentemente se gabam de como seus processadores móveis mais recentes permitirão operações de IA no dispositivo, como a criação de vídeos.

Já chegamos lá, embora não completamente. Em meio a todo o entusiasmo em torno dos truques de IA que acertam e falham para usuários de smartphones, a discussão raramente vai além de exibições chamativas de novos processadores e chatbots em constante evolução.

Foi somente quando a ausência do Gemini Nano no Google Pixel 8 causou surpresa que o público aprendeu sobre a importância crítica da capacidade de RAM para a IA em dispositivos móveis. A Apple também esclareceu rapidamente que manteria o Apple Intelligence bloqueado em dispositivos com pelo menos 8 GB de RAM. Esta decisão reflete a importância da RAM na execução eficiente de modelos de IA.

Mas a imagem de um “telefone com IA” não se resume apenas à capacidade de memória. O desempenho do seu telefone em tarefas com tecnologia de IA também depende de otimizações invisíveis de RAM e armazenamento. E não, não estou falando apenas de capacidade.

Inovações de memória estão chegando aos telefones com IA.

A Digital Trends conversou com a Micron, líder global em soluções de memória e armazenamento, para analisar o papel da RAM e do armazenamento nas operações de IA em smartphones. Os avanços da Micron devem estar no seu radar na próxima vez que você estiver comprando um telefone premium.

Os produtos mais recentes da empresa sediada em Idaho incluem armazenamento móvel G9 NAND UFS 4.1 e módulos de RAM 1γ (1-gama) LPDDR5X para smartphones principais. Então, como essas soluções de memória avançam a IA em smartphones, além de aumentar a capacidade?

Vamos começar com a solução de armazenamento NAND UFS 9 do G4.1. A principal promessa é consumo econômico de energia, latência reduzida e alta largura de banda.. O padrão UFS 4.1 pode atingir velocidades máximas de leitura e gravação sequencial de 4100 MB/s, um aumento de 15% em relação à geração UFS 4.0, reduzindo também os números de latência.

Outro benefício crucial é que as unidades de armazenamento portáteis de última geração da Micron estão disponíveis em capacidades de até 2 TB. Além disso, o Micron conseguiu reduzir seu tamanho, tornando-se uma solução ideal para telefones dobráveis e telefones finos de última geração, como Samsung Galaxy Borda S25.

Passando para os avanços da RAM, a Micron desenvolveu o que chama de módulos de RAM 1γ LPDDR5X. Ele oferece uma velocidade máxima de 9200 MT/s, pode conter 30% mais transistores devido ao tamanho reduzido e consome 20% menos energia ao mesmo tempo. A Micron já introduziu a solução de RAM 1β (1-beta) um pouco mais lenta encontrada na série de smartphones Samsung Galaxy S25.

A interação entre armazenamento e inteligência artificial

Ben Rivera, diretor de marketing de produtos da Unidade de Negócios Móveis da Micron, explicou que a Micron introduziu quatro melhorias importantes em suas soluções de armazenamento mais recentes para garantir operações de IA mais rápidas em dispositivos móveis. Essas melhorias incluem Zoned UFS, Data Defragmentation, Pinned WriteBooster e Intelligent Latency Tracker.

“Esse recurso permite que o processador ou host identifique e isole ou ‘fixe’ os dados usados com mais frequência no smartphone em uma área do dispositivo de armazenamento chamada buffer WriteBooster (semelhante a um cache) para permitir acesso rápido e imediato a eles”, explica Rivera sobre o recurso Pinned WriteBooster.

Cada modelo de IA — como Google Gemini ou ChatGPT — que busca executar tarefas em um dispositivo precisa de seu próprio conjunto de arquivos de instruções armazenados localmente no dispositivo móvel. Por exemplo, você precisa Apple Intelligence com até 7 GB de espaço de armazenamento Para todas as suas operações.

Para executar uma tarefa, você não pode delegar toda a pilha de IA à RAM, pois ela precisará de espaço para processar outras tarefas importantes, como fazer chamadas ou interagir com outros aplicativos importantes. Para lidar com as limitações do armazenamento Micron, é criado um mapa de memória que carrega apenas os pesos de IA necessários do armazenamento para a RAM.

Quando os recursos se tornam limitados, o que você precisa é de troca e leitura de dados mais rápidas. Isso garante que suas tarefas de IA sejam executadas sem afetar a velocidade de outras tarefas importantes. Graças ao Pinned WriteBooster, essa troca de dados é acelerada em 30%, garantindo que as tarefas de IA sejam processadas sem qualquer atraso.

Suponha que você precise Gemini para extrair arquivo PDF para análise. A troca rápida de memória garante que os pesos de IA necessários sejam transferidos rapidamente do armazenamento para a RAM.

Em seguida, temos o Desfragmentador de Dados. Pense nele como um organizador de mesa ou armário, garantindo que os objetos sejam agrupados ordenadamente em diferentes categorias e colocados em seus armários exclusivos para que sejam fáceis de encontrar.

No contexto dos smartphones, embora uma grande quantidade de dados seja armazenada durante um longo período de uso, eles normalmente são armazenados de forma um tanto aleatória. O efeito líquido é que, quando o sistema de bordo precisa acessar um tipo específico de arquivo, torna-se mais difícil encontrar todos eles, resultando em uma operação mais lenta.

De acordo com Rivera, o Data Defrag não só ajuda no armazenamento organizado de dados, mas também muda a maneira como o dispositivo de armazenamento interage com o controlador do dispositivo. Assim, é Aumenta a velocidade de leitura de dados em incríveis 60%, acelerando naturalmente todos os tipos de interações entre usuário e dispositivo, incluindo tarefas de IA.

“Esse recurso pode ajudar a acelerar os recursos de IA, como quando um modelo de IA generativo, como o usado para gerar uma imagem a partir de um prompt de texto, é chamado do armazenamento para a memória, permitindo que os dados sejam lidos mais rapidamente do armazenamento para a memória”, disse um funcionário da Micron ao Digital Trends.

O Intelligence Latency Tracker é outro recurso que basicamente monitora eventos de latência e fatores que podem diminuir o ritmo normal do seu telefone. Mais tarde, ele ajuda a corrigir erros e melhorar o desempenho do telefone para garantir que tarefas normais, bem como tarefas de IA, não encontrem problemas de velocidade.

A melhoria final no armazenamento é o Zoned UFS. Este sistema garante que dados de natureza de entrada/saída semelhante sejam armazenados de maneira organizada. Isso é muito importante porque torna mais fácil para o sistema localizar os arquivos necessários, em vez de perder tempo procurando em todas as pastas e diretórios.

“O recurso ZUFS da Micron ajuda a organizar dados para que, quando o sistema precisar localizar dados específicos para uma tarefa, o processo seja mais rápido e tranquilo”, disse Rivera.

Estouro de RAM

Quando se trata de fluxos de trabalho de IA, você precisa de uma certa quantidade de RAM. Quanto maior a capacidade, melhor. Embora a Apple tenha definido o limite de 8 GB para seu pacote Apple Intelligence, os participantes do ecossistema Android adotaram 12 GB como padrão seguro. por que?

“As experiências de IA também exigem muitos dados e muita energia”, explica Rivera. “Portanto, para cumprir a promessa da IA, a memória e o armazenamento devem oferecer baixa latência e alto desempenho com máxima eficiência energética.”

Com sua solução de DRAM LPDDR5X 1γ (1-gama) de última geração para smartphones, a Micron conseguiu reduzir a tensão operacional dos módulos de memória. Depois há a questão importantíssima do desempenho local. Rivera diz que os novos módulos de memória podem operar em velocidades de até 9.6 gigabits por segundo, garantindo excelente desempenho de IA.

A Micron diz que as melhorias em seu processo de litografia ultravioleta extrema (EUV) abriram as portas não apenas para velocidades mais altas, mas também para um aumento saudável de 20% na eficiência energética.

O caminho para experiências de IA mais personalizadas?

As soluções de RAM e armazenamento de última geração da Micron para smartphones visam não apenas melhorar o desempenho da IA, mas também acelerar de forma geral suas tarefas diárias com o smartphone. Fiquei pensando se o armazenamento móvel NAND UFS 9 aprimorado do G4.1 e a RAM LPDDR1X 1γ (5-gama) também acelerariam os processadores de IA offline.

Os fabricantes de smartphones, bem como os laboratórios de IA, estão cada vez mais migrando para o processamento local de IA. Isso significa que, em vez de enviar suas consultas para um servidor em nuvem onde o processo é processado e, em seguida, o resultado é enviado para seu telefone usando uma conexão de internet, todo o fluxo de trabalho é executado localmente no seu telefone.

Da transcrição de chamadas e notas de voz ao processamento de materiais de pesquisa complexos em PDFs, tudo acontece no seu telefone, e nenhum dado pessoal sai do seu dispositivo. Também é uma abordagem mais segura e rápida, mas ao mesmo tempo requer recursos de sistema poderosos. Um módulo de memória mais rápido e eficiente é um desses requisitos essenciais.

As soluções de próxima geração da Micron podem ajudar a abordar a IA localmente? Ela pode. Na verdade, ele também acelerará processos que exigem uma conexão em nuvem, como a criação de vídeos usando o modelo Veo do Google, que ainda requer servidores de computação poderosos.

“Um aplicativo de IA nativo executado diretamente no dispositivo terá mais tráfego porque não apenas lê dados do usuário do dispositivo de armazenamento, mas também realiza inferência de IA no dispositivo”, diz Rivera. “Nesse caso, nossos recursos ajudarão a otimizar o fluxo de dados para ambos.”

Então, quando você pode esperar que os telefones equipados com as soluções mais recentes da Micron cheguem às prateleiras? Rivera diz que todos os principais fabricantes de smartphones adotarão os módulos de RAM e armazenamento de próxima geração da Micron. Em termos de acesso ao mercado, “modelos principais com lançamento previsto para o final de 2025 ou início de 2026” devem estar no seu radar de compras.