Criptomoedas

OpenAI lança seu primeiro chip próprio: o que muda na guerra da IA

OpenAI apresentou o Jalapeño, processador de inferência desenvolvido com a Broadcom. O chip promete reduzir custos e a dependência da Nvidia.

OpenAI lança seu primeiro chip próprio: o que muda na guerra da IA
Foto: Tima Miroshnichenko / Unsplash

A OpenAI deu um passo decisivo na corrida pela infraestrutura de inteligência artificial. Na quarta-feira, a empresa revelou o Jalapeño, seu primeiro processador customizado de inferência, desenvolvido em parceria com a Broadcom. O movimento coloca a companhia de Sam Altman no mesmo caminho já percorrido por Google e Amazon: construir seu próprio silício para depender menos da Nvidia.

Mais do que uma novidade técnica, o chip representa uma mudança estratégica profunda. A OpenAI está deixando de ser apenas uma empresa de modelos e produtos para se tornar uma operadora verticalizada de toda a cadeia da IA, do silício ao software que o usuário final enxerga.

O que é o Jalapeño e por que ele importa

O Jalapeño é um processador projetado especificamente para inferência, a etapa em que um modelo de IA já treinado processa comandos e gera respostas em tempo real. É o que acontece toda vez que alguém usa o ChatGPT, pede ao Codex para escrever código ou interage com qualquer produto da OpenAI.

Diferente do treinamento, que exige poder computacional bruto para processar trilhões de parâmetros durante semanas, a inferência é um processo contínuo e de escala massiva. Cada consulta de cada usuário consome recursos. A OpenAI afirmou que os primeiros testes mostram desempenho por watt significativamente superior às alternativas disponíveis no mercado.

Greg Brockman, presidente da OpenAI, explicou a lógica por trás da decisão em um podcast interno da empresa, ainda quando a parceria com a Broadcom foi anunciada em outubro. “Temos um entendimento profundo da carga de trabalho. Estávamos buscando tarefas específicas mal atendidas e perguntando como podemos construir algo que acelere o que é possível”, disse Brockman.

Um detalhe curioso: a própria OpenAI usou seus modelos de IA para auxiliar no desenvolvimento do chip. É um ciclo de retroalimentação que pode se tornar cada vez mais comum na indústria de semicondutores.

Reduzir custos de inferência é o grande jogo econômico da IA

Para entender por que isso importa, basta olhar para os números. A OpenAI gastou bilhões de dólares em computação nos últimos anos, e a maior parte desse custo vem de GPUs da Nvidia, que dominam o mercado de aceleradores de IA com participação estimada acima de 80%. Como analisamos em nossa cobertura de tecnologia, essa concentração cria um gargalo financeiro e estratégico para qualquer empresa que dependa de computação massiva.

O Jalapeño não substitui a Nvidia no treinamento de modelos. Tarefas de pré-treinamento, que exigem clusters de milhares de GPUs por semanas, provavelmente continuarão rodando em hardware da Nvidia por um bom tempo. Mas a inferência responde por uma fatia crescente dos custos operacionais, à medida que produtos como o ChatGPT escalam para centenas de milhões de usuários.

Mesmo reduções modestas no custo por consulta se multiplicam em economia significativa quando aplicadas a bilhões de interações mensais. A OpenAI destacou que o chip apresenta custos operacionais baixos especialmente ao rodar modelos de codificação em tempo real, uma referência direta ao Codex e aos produtos agênticos que a empresa vem lançando.

A verticalização total: do chip ao produto

O movimento da OpenAI segue uma tendência clara entre as grandes empresas de tecnologia. O Google desenvolveu as TPUs (Tensor Processing Units) há quase uma década. A Amazon criou os chips Trainium e Inferentia para a AWS. A Meta também investe em silício próprio. Todas seguem a mesma lógica: quem controla o hardware controla a margem.

O que torna o caso da OpenAI particularmente relevante é o grau de verticalização. A empresa agora opera em praticamente todas as camadas: arquitetura de chip, kernels, sistemas de memória, redes, agendamento, sistemas de implantação e experiência do produto final. É uma integração vertical comparável ao que a Apple fez com o iPhone ao desenvolver seus próprios processadores da série M e A.

“A OpenAI não está apenas desenvolvendo modelos de fronteira ou construindo produtos sobre eles. Está projetando a infraestrutura por baixo: arquitetura de chip, kernels, sistemas de memória, rede, agendamento, sistemas de implantação e experiência do produto”, afirmou a empresa no anúncio. “Como opera em toda a pilha, cada camada pode ser otimizada em torno do mesmo objetivo: tornar seus modelos mais rápidos, confiáveis e acessíveis.”

O que isso significa para o mercado e para a Nvidia

Para a Nvidia, o surgimento de mais um cliente relevante desenvolvendo chips próprios reforça uma pressão que já existe. Apesar de continuar sendo a líder absoluta em GPUs para treinamento de IA, a empresa de Jensen Huang enfrenta um cenário em que seus maiores compradores estão, simultaneamente, tentando reduzir a dependência de seus produtos. Como discutimos na análise sobre big techs e chips próprios, essa dinâmica não elimina a Nvidia do jogo, mas limita seu poder de precificação no longo prazo.

Para o ecossistema de IA como um todo, a tendência de chips especializados para inferência deve acelerar. Startups de semicondutores focadas nesse nicho, como Groq e Cerebras, também disputam esse mercado. A diferença é que a OpenAI tem algo que poucos têm: conhecimento íntimo da carga de trabalho, escala de usuários para justificar o investimento e capital para bancá-lo.

O Jalapeño ainda está em fase de testes e não há data pública para implantação em larga escala. Mas a mensagem estratégica já está dada. A OpenAI quer ser dona de toda a pilha tecnológica que sustenta seus produtos. Em uma indústria onde margem e eficiência operacional definem quem sobrevive, controlar o silício pode ser tão importante quanto treinar o melhor modelo.

Compartilhar
Sobre o autor
Renato Moura
Jornalista especializado em finanças, tecnologia e criptoativos. Cobre mercados financeiros, inovação e os impactos da economia digital no Brasil e no mundo.
Continue scrollando para a próxima matéria…