Grandes Modelos de Negócios (LAMs) estão revolucionando o mundo da IA em comparação aos modelos tradicionais.
O surgimento de chatbots generativos com tecnologia de IA deu origem ao conceito de um “modelo de linguagem ampla” (LLM), uma tecnologia avançada de IA que analisa e entende a linguagem natural para gerar respostas significativas com base nas consultas dos usuários. Grandes modelos de linguagem são capazes de gerar conteúdo consistente e semelhante ao humano, dando a impressão de que a IA tem algum tipo de “pensamento” próprio.
No entanto, os modelos de linguagem não são a única tecnologia que contribui para o desenvolvimento da inteligência artificial; Grandes Modelos de Negócios (LAMs) podem ser o próximo passo. Esses modelos se concentram em aprimorar capacidades analíticas e de tomada de decisão em contextos práticos, potencialmente transformando áreas como automação e gestão empresarial. Neste artigo, aprenderemos como os LLMs e os LAMs funcionam e seu crescente impacto na melhoria das aplicações de IA e na expansão de seu escopo.

O que é um Grande Modelo de Negócios (LAM)?
Um Large Action Model (LAM) é um modelo de inteligência artificial capaz de compreender a entrada humana e executar a ação correspondente, tornando-o capaz de interagir com o mundo de maneira semelhante à humana. Esta é uma abordagem ligeiramente diferente dos modelos de IA que se concentram apenas na geração de respostas. O termo “grande modelo de negócios” foi introduzido pela primeira vez pela Rabbit Inc, desenvolvedora do Rabbit R1. No vídeo de lançamento do Rabbit R1 da empresa, diz-se que o LAM é um novo modelo fundamental que ajuda a passar a IA das palavras à ação.
Os LAMs são treinados em grandes conjuntos de dados de ação do usuário; Conseqüentemente, eles aprendem imitando ações humanas ou por meio de demonstração. Através da demonstração, o modelo LAM pode compreender e navegar nas interfaces de usuário de diferentes sites ou aplicativos móveis e realizar ações específicas com base em suas instruções. De acordo com CoelhoO LAM pode conseguir isso mesmo se a interface for ligeiramente alterada.
Você pode pensar nos LAMs como uma extensão dos recursos existentes dos LLMs. Enquanto saídas de texto ou mídia generativas em LLMs dependem da entrada do usuário ao prever a próxima palavra ou token (você faz uma pergunta e o modelo LLM fornece saídas de texto ou mídia), os LAMs vão além ao adicionar a capacidade de executar ações complexas em seu nome.
O que os LAMs podem fazer?
Os LAMs tratam da execução de ações complexas em seu nome. No entanto, o ponto crucial a ser observado é a capacidade de realizar procedimentos complexos. Isso torna os LAMs mais úteis para tarefas avançadas, mas não significa que não possam realizar procedimentos mais simples.
Em teoria, isto significa que poderia, por exemplo, pedir ao modelo LAM para fazer algo em seu nome, como pedir um café no café local, ou uma viagem de Uber, e até fazer uma reserva de hotel. Portanto, é diferente de realizar tarefas simples, como pedir ao Google Assistant, Siri ou Alexa para ligar a TV ou as luzes da sala.
Nos bastidores, de acordo com a visão compartilhada pela Rabbit Inc., o modelo LAM é capaz de acessar um site ou aplicativo relevante, como o Uber, e navegar pela sua interface para realizar uma ação, como solicitar uma viagem ou cancelá-la caso mude de ideia.
Os LAMs superarão os LLMs, mas (ainda) não estão prontos
O conceito de LAMs é estimulante, talvez mais do que o de LLMs. Os Grandes Modelos de Ação (LAMs) serão o futuro após a IA generativa, permitindo-nos compensar tarefas mundanas e concentrar-nos noutras atividades gratificantes. No entanto, por mais emocionante que pareça, os LAM ainda não estão prontos.
O primeiro produto comercial que prometia alavancar o LAM (Rabbit r1) não cumpriu totalmente a sua promessa de marketing de realizar ações em nome dos seus utilizadores. O dispositivo falhou tanto em seu principal ponto de venda que muitas análises em primeira mão o descreveram como bastante inútil.
Pior ainda, uma investigação do YouTuber Coffeezilla, em colaboração com um seleto grupo de engenheiros de software com acesso a parte da base Rabbit r1, descobriu que o Rabbit usava scripts Playwright para executar ações em vez de LAM. Portanto, em vez de uma máquina executando um modelo de IA exclusivo, ela estava apenas executando um conjunto de instruções If > then; Muito longe do prometido modelo LAM.
Se há algo que você pode tirar do Rabbit r1, é que sim, a visão está lá. No entanto, o trabalho precisa ser feito antes da implementação, então não fique animado ainda.
Comentários estão fechados.