Acabei de assistir à entrevista do Stratechery com Sam Altman e Matt Garman sobre o que realmente está a acontecer entre a OpenAI e a AWS, e honestamente, isso muda toda a perspetiva que tínhamos sobre IA empresarial.



Portanto, a manchete de que todos estão a falar é óbvia: o acordo de exclusividade da Microsoft com a Azure acabou. A OpenAI agora pode oferecer modelos através da AWS e de outras nuvens. Mas aqui está o ponto—isso é quase a parte mais aborrecida da história.

A verdadeira mudança é muito mais fundamental. Estamos a passar de "empresas a chamar APIs" para "empresas a executarem agentes de IA reais dentro da sua infraestrutura." Pense assim: em vez do ChatGPT ser um chatbot inteligente com quem conversa, imagine um colega de IA que realmente trabalha dentro da sua empresa, acede às suas bases de dados, respeita os seus sistemas de permissões e faz as coisas acontecerem.

Bedrock Managed Agents é o que isso parece na prática. Não é só "modelos da OpenAI agora disponíveis na AWS." É os modelos da OpenAI profundamente integrados em toda a pilha nativa da AWS—gestão de identidade, permissões, registos, segurança, implantação, tudo. Os modelos rodam dentro da sua VPC, os seus dados nunca saem da AWS, e o agente entende os limites da sua empresa.

Sam fez um ponto que ficou comigo: costumava ver o modelo e a infraestrutura de suporte como coisas separadas. Agora, já não. Quando o Codex faz algo incrível, não dá para distinguir bem quanto é o modelo a ser inteligente versus o sistema à sua volta a estar bem desenhado. Eles estão a tornar-se uma coisa só.

Matt Garman trouxe à tona algo igualmente importante: as empresas neste momento estão literalmente a montar as suas próprias soluções. Querem agentes que lembrem o contexto, que trabalhem através dos seus sistemas, que entendam os seus dados, que respeitem a sua segurança. Cada empresa está a fazer isso por si própria. O que a AWS e a OpenAI estão a fazer é dizer: nós tratamos dessa integração por si, para que não tenha que fazer tudo sozinho.

A questão das permissões e segurança é enorme aqui. Antes, era como um modelo de segurança de "castelo e fosso"—tudo local, assume-se que é seguro. Agora, precisa-se de uma arquitetura de confiança zero. Cada agente precisa da sua própria identidade, das suas permissões. Ainda estão a descobrir os modelos mentais para isto. Tipo, um agente de IA deve usar a conta do seu funcionário, mas identificar-se como um agente? Ainda nem têm os conceitos básicos definidos, mas sabem que isso importa.

O que é louco é como isto espelha o que aconteceu com a computação em nuvem há 20 anos. A AWS fez com que as startups não precisassem de comprar os seus próprios servidores e contratar equipas de infraestrutura. Agora, a OpenAI e a AWS tentam fazer o mesmo para IA empresarial: diminuir a barreira para realmente implementar agentes que funcionem, sem que as empresas tenham que montar modelos, permissões, sistemas de dados e arquitetura de segurança por si próprias.

Sam também mencionou algo interessante sobre o futuro da precificação. Agora, eles cobram por tokens, mas isso já está a ficar desatualizado. O novo modelo deles custa mais por token, mas precisa de muito menos tokens para obter a mesma resposta. O que os clientes realmente querem pagar é por "inteligência entregue", não por "tokens consumidos." É uma mudança subtil, mas altera toda a forma de pensar no negócio.

Na frente da concorrência, este é o momento em que o jogo muda de "quem tem o melhor modelo" para "quem consegue transformar modelos em infraestrutura empresarial real." O Google está a fazer uma integração vertical completa. A AWS está a seguir um caminho diferente: uma camada de infraestrutura forte, parceria com os melhores modelos, deixando as empresas escolherem o que funciona. Sam e Matt parecem genuinamente convencidos de que estão a construir algo diferenciado aqui, não só "finalmente podemos aceder à OpenAI através da AWS."

Mais uma coisa: Sam mencionou que a procura por modelos de fronteira ainda é astronómica. As pessoas ainda não estão a comparar preços. Todos querem o modelo de ponta porque é o que faz o trabalho avançar. Mas, à medida que os custos descem e modelos menores melhoram, provavelmente surgirá uma mistura. Ainda parece cedo, no entanto.

Toda a conversa parece de duas empresas que realmente respeitam as forças uma da outra a construir algo real. Vale a pena ler o artigo completo do Stratechery se quiseres os detalhes técnicos, mas a ideia central é sólida: já não estamos a falar de canais de distribuição. Estamos a falar de um paradigma de computação completamente diferente a emergir.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar