Oracle e NVIDIA colaboram para ajudar as empresas a acelerar a inferência de agentes de IA
A Oracle e a NVIDIA anunciam uma integração entre o software de inferência e computação acelerada da NVIDIA com a infraestrutura de IA da Oracle e serviços de IA generativa. O objetivo das empresas é ajudar as organizações a acelerar globalmente a criação de aplicações de IA.
Com a integração entre o Oracle Cloud Infrastructure (OCI) e a plataforma de software NVIDIA AI Enterprise, mais de 160 ferramentas de IA e mais de 100 microsserviços NVIDIA NIM ficarão disponíveis nativamente por meio do console OCI.
Além disso, a Oracle e a NVIDIA estão colaborando na implantação sem código dos Blueprints de IA da Oracle e da NVIDIA e na aceleração da pesquisa vetorial de IA no Oracle Database 23ai com a biblioteca NVIDIA cuVS.
Notícias Relacionadas:
- Dell foca em inovação em IA empresarial do PC ao Data Center com NVIDIA
- NVIDIA destaca novos clientes em sua plataforma Omniverse para IA física
- O que dá para comprar com o valor de uma NVIDIA GeForce RTX 5090?
Sobre a parceria

Com a parceria, o NVIDIA AI Enterprise estará disponível nativamente por meio do Console OCI, permitindo que os clientes acessem de forma rápida e fácil as ferramentas de IA. A previsão é reduzir o tempo necessário de implementação de modelos.
A integração inclui o NVIDIA NIM – um conjunto de mais de 100 microsserviços de inferência otimizados e nativos da nuvem para os principais modelos de IA. Dentre eles, estão os mais recentes modelos NVIDIA Llama Nemotron para raciocínio avançado de IA.
O NVIDIA AI Enterprise estará disponível como uma imagem de implantação para instâncias bare-metal da OCI e clusters Kubernetes usando o OCI Kubernetes Engine. Os clientes do OCI Console se beneficiam do faturamento direto e do suporte ao cliente por meio da Oracle.
As organizações podem implementar os mais de 150 serviços de IA e cloud da OCI com a computação acelerada da NVIDIA e com a NVIDIA AI Enterprise no data center, no cloud público ou no edge. Com isso, as organizações possuem uma pilha de IAs integradas para ajudar a atender aos requisitos de privacidade de dados, IA soberana e baixa latência.
Blueprints

Os Blueprints de IA da OCI fornecem modelos de implementação sem código que permitem executar rapidamente cargas de trabalho de IA. Além disso, eles oferecem recomendações claras de hardware para GPUs NVIDIA, microsserviços NIM e ferramentas de observabilidade pré-empacotadas.
O NVIDIA Blueprints oferece aos desenvolvedores uma experiência unificada, fornecendo fluxos de trabalho de referência para casos de uso de IA corporativa. Com eles, as organizações podem criar e operacionalizar aplicações de IA personalizadas com o software NVIDIA AI Enterprise e NVIDIA Omniverse, interfaces de programação de aplicações e microsserviços.
Tanto a Oracle como a NVIDIA planejam simplificar o desenvolvimento, a implantação e o escalonamento de aplicações de IA e simulação. Para tanto, a plataforma NVIDIA Omniverse e as estações de trabalho de desenvolvimento NVIDIA Isaac Sim e o Omniverse Kit App Streaming devem estar disponíveis no Oracle Cloud Infrastructure Marketplace ainda este ano.
A integração trará pré-configurações com instâncias bare-metal de computação aceleradas pelas GPUs NVIDIA L40S.
Inferência de IA em tempo real

Com a parceria, as empresas querem permitir que os cientistas de dados possam acessar os microsserviços NVIDIA NIM pré-otimizados diretamente no OCI Data Science. Isso oferece suporte a casos de uso de inferência de IA em tempo real sem a complexidade de gerenciar a infraestrutura.
Os modelos serão executados na locação da OCI do cliente, com a opção de cobrança por hora de utilização ou aplicando Oracle Universal Credits.
As organizações podem usar essa integração para implantar endpoints de inferência com mecanismos de inferência NIM pré-configurados e otimizados em minutos. Isso acelera o tempo de retorno para casos de uso, como assistentes com tecnologia de IA, mecanismos de recomendação em tempo real e copilotos.
Com a facilitação do uso, os clientes podem começar a usar a integração para cargas de trabalho menores e escalar perfeitamente para implementações em toda a empresa. E a aceleração no desenvolvimento e na implementação deve reduzir custos das empresas.
Oracle Database 23ai
A Oracle e a NVIDIA estão trabalhando juntas para acelerar a criação de embeddings vetoriais e índices vetoriais usando GPUs NVIDIA e NVIDIA cuVS. Trata-se de partes de computação intensiva das cargas de trabalho de AI Vector Search no Oracle Database 23ai.
As organizações poderão incorporar vetores por meio da vetorização em massa de grandes volumes de dados de entrada, como texto, imagens e vídeos, além de rápida criação e manutenção de índices vetoriais.
Com a integração do AI Vector Search ao Oracle Database, há melhora de desempenho dos pipelines de IA e ela ajuda a suportar cargas de trabalho vetoriais de IA de alto volume.
NVIDIA Blackwell na OCI

A OCI estará entre os primeiros provedores de serviços em nuvem a oferecer a próxima geração da plataforma de computação acelerada NVIDIA Blackwell. Criada com base na inovadora arquitetura Blackwell apresentada há um ano, a Blackwell Ultra inclui a solução em escala de rack NVIDIA GB300 NVL72 e o sistema NVIDIA HGX™ B300 NVL16.
O GB300 NVL72 oferece 1,5 vezes mais desempenho de AI do que o NVIDIA GB200 NVL72, além de aumentar a oportunidade de receita da Blackwell em 50 vezes para fábricas de AI. Os números são em comparação com aquelas construídas com o NVIDIA Hopper.
Fonte: NVIDIA.