Cloud Destaques IA International News Notícias

Oracle Cloud Infrastructure Expands NVIDIA GPU-Accelerated Instances for AI, Digital Twins and More

Por Ariadni Stangherlin Mamede29 de julho de 20246 Mins de leitura

New OCI (Oracle Cloud Infrastructure) Compute instances accelerated by NVIDIA L40S now available to order

By Rohil Bhargava and Dave Salvator

Rohil e Dave — Rohil Bhargava, Product Marketing at NVIDIA AI and Dave Salvator, Director of Accelerated Computing Products at NVIDIA

Enterprises are rapidly adopting generative AI, large language models (LLMs), advanced graphics and digital twins to increase operational efficiencies, reduce costs and drive innovation.

However, to adopt these technologies effectively, enterprises need access to state-of-the-art, full-stack accelerated computing platforms.

To meet this demand, Oracle Cloud Infrastructure (OCI) today announced NVIDIA L40S GPU bare-metal instances available to order and the upcoming availability of a new virtual machine accelerated by a single NVIDIA H100 Tensor Core GPU. This new VM expands OCI’s existing H100 portfolio, which includes an NVIDIA HGX H100 8-GPU bare metal instance.

Paired with NVIDIA networking and running the NVIDIA software stack, these platforms deliver unmatched performance and efficiency, enabling enterprises to advance generative AI.

NVIDIA L40S Now Available to Order on OCI

The NVIDIA L40S is a universal data center GPU designed to deliver breakthrough multi-workload acceleration for generative AI, graphics and video applications. Equipped with fourth generation Tensor Cores and support for the FP8 data format, the L40S excels in training and fine-tuning small- to midsize LLMs and in inference across a wide range of generative AI use cases.

For example, a single L40S (FP8) can generate up to 1.4x more tokens per second than a single NVIDIA A100 Tensor Core GPU (FP16) for Llama-3-8B with NVIDIA TensorRT-LLM at an input and output sequence length of 128.

The L40S also has best-in-class graphics and media acceleration. Its third-generation NVIDIA Ray Tracing Cores (RT Cores) and multiple encode/decode engines make it ideal for advanced visualization and digital twin applications.

L40S delivers up to 3.8x the real-time ray-tracing performance of its predecessor, and supports NVIDIA DLSS 3 for faster rendering and smoother frame rates. This makes the GPU ideal for developing applications on the NVIDIA Omniverse platform, enabling real-time, photorealistic 3D simulations and AI-enabled digital twins.

With Omniverse on L40S, enterprises can develop advanced 3D applications and workflows for industrial digitalization that will allow them to design, simulate and optimize products, processes, and facilities in real time before going into production.

OCI will offer the L40S GPU in its BM.GPU.L40S.4 bare-metal compute shape, featuring four NVIDIA L40S GPUs, each with 48GB of GDDR6 memory. This shape includes local NVMe drives with 15.36TB capacity, 4th Generation Intel Xeon CPUs with 112 cores, and 1TB of system memory.

These shapes eliminate the overhead of any virtualization for high-throughput and latency-sensitive AI or machine learning workloads to deliver strong bare-metal performance. The accelerated compute shape features the NVIDIA BlueField-3 DPU for improved server efficiency, offloading data-center tasks from CPUs to accelerate networking, storage and security workloads. The use of BlueField furthers OCI’s strategy of off-box virtualization across its entire fleet.

OCI Supercluster with NVIDIA L40S enables ultra-high performance with 800Gbps of internode bandwidth and low latency for up to 3,840 GPUs. OCI’s cluster network uses NVIDIA ConnectX-7 NICs over RoCE v2 to support high-throughput and latency-sensitive workloads.

“We chose OCI AI infrastructure with bare metal instances and NVIDIA L40S GPUs for 30%
more efficient video encoding. Videos processed with Beamr Cloud on OCI will have up to 50% reduced storage and network bandwidth consumption, speeding up file transfers by 2x and increasing productivity for end-users. Beamr will provide OCI customers video AI workflows, preparing them for the future of video” –Sharon Carmel, CEO, Beamr Cloud

Single-GPU H100 VMs Coming Soon on OCI

The VM.GPU.H100.1 compute virtual machine shape, accelerated by a single NVIDIA H100 Tensor Core GPU, is coming soon to OCI. This will provide cost-effective on-demand access for enterprises looking to use the power of NVIDIA H100 GPUs for their generative AI and HPC workloads.

A single H100 provides a good platform for smaller workloads and LLM inference. For example, one H100 GPU can generate more than 27,000 tokens per second for Llama 3 8B (up to 4x more throughput than a single A100 at FP16 precision) with NVIDIA TensorRT-LLM at an input and output sequence length of 128 and FP8 precision.

The VM.GPU.H100.1 shape includes 3.4TB of NVMe drive capacity, 16 cores of 4th Gen Intel Xeon processors and 14GB of system memory, making it well-suited for a range of AI tasks.

“Oracle Cloud’s bare metal compute with NVIDIA H100 and A100 GPUs, low-latency Supercluster, and high-performance storage delivers up to 20% better price-performance for Altair’s computational fluid dynamics (CFD) and structural mechanics solvers. We look forward to leveraging these GPUs with virtual machines for the Altair Unlimited virtual appliance.” Yeshwant Mummaneni, Chief Engineer, Data Management and Analytics, Altair

GH200 Bare-Metal Instances Available for Validation

OCI has also made available the BM.GPU.GH200 compute shape for customer testing. It features the NVIDIA Grace Hopper Superchip and NVLink-C2C, a high-bandwidth 900GB/s connection between the NVIDIA Grace CPU and Hopper GPU. This provides unified cache coherence and over 600GB of accessible memory, enabling up to 10x higher performance for applications running terabytes of data compared to NVIDIA A100.

Optimized Software for Enterprise AI

Enterprises have a wide variety of NVIDIA GPUs to accelerate their AI, HPC and data analytics workloads on OCI. However, maximizing the full potential of these GPU-accelerated compute instances requires an optimized software layer.

NVIDIA NIM, part of the NVIDIA AI Enterprise software platform available on the OCI Marketplace, is a set of easy-to-use microservices designed for secure, reliable deployment of high-performance AI model inference to deploy world-class generative AI applications.

Optimized for NVIDIA GPUs, NIM pre-built containers offer developers improved cost of ownership, faster time to market, and security. NIM microservices for popular community models, found on the NVIDIA API Catalog, can be deployed on OCI.

Performance will continue to improve over time with the monthly cadence of NIM releases and with upcoming GPU-accelerated instances, including NVIDIA H200 Tensor Core GPUs and NVIDIA Blackwell GPUs.

Diebold Nixdorf lança DN Cloud Retail para gestão integrada do varejo

AbraCloud realiza a primeira pesquisa sobre o perfil dos provedores de nuvem nacionais

Qlik lança Qlik Talend Cloud, fornecendo bases confiáveis de Inteligência Artificial para empresas modernas

Acompanhe os principais conteúdos sobre Cloud!

Cadastre-se para receber o IDNews e acompanhe o melhor conteúdo do Brasil sobre Identificação Digital! Aqui!

Compartilhe:

ÚLTIMAS NOTÍCIAS

Cibersegurança

Aeroporto Internacional da Malásia foi alvo de ciberataque que afetou seus sistemas digitais

Por Regina Tupinambá28 de março de 2025

O Papel da IA no Bem-Estar Moderno

28 de março de 2025

Propriedade Intelectual: Proteja suas criações com o Assinatura Certa

28 de março de 2025

LGPD e assinaturas digitais: como evitar multas em 2025?

28 de março de 2025

Os prós e contras da inteligência artificial na cibersegurança

28 de março de 2025

Falta de dados prontos para Inteligência Artificial coloca projetos de IA em risco

28 de março de 2025

Aplicativo Dynatrace Cost & Carbon Optimization recebe certificação da SDIA

28 de março de 2025

Quais são os documentos jurídicos e como gerenciá-los na sua empresa?

28 de março de 2025

Receba novidades

Cadastre-se em nossa newsletter e fique ligado em tudo que acontece no Crypto ID.

Eventos

março, 2025

Filtrar eventos

Ordenar por:

Data

Título

Cor

Postado

Tipo de evento:

Todos

Local do evento:

Todos

Organizador do evento:

Todos

11marallday2º Congresso sobre Prevenção e Repressão a Fraude promovido pela Febrabandias 11 e 12 de março de 2025(Dia inteiro) Distrito Anhembi - Centro de convenções, Av. Olavo Fontoura 1209

Mais

Detalhes do evento

Febraban promoverá 2º Congresso de Prevenção e Repressão a Fraudes, Segurança Cibernética e Bancária e inscrições já estão abertas

As inscrições para o 2º Congresso de Prevenção e Repressão a Fraudes, Segurança Cibernética e Bancária já estão abertas.

O evento, promovido pela Febraban e seus bancos associados, será realizado nos dias 11 e 12 de março de 2025, de forma presencial em São Paulo, com transmissão online pela plataforma FEBRABAN TECH.

Depois do sucesso da primeira edição, em 2024, o congresso crescerá em 2025, reafirmando o compromisso com a promoção da segurança bancária. Contará com um terceiro palco, ampliando as opções de conteúdo para os congressistas.

O congresso é mais uma iniciativa do setor bancário, que segue investindo fortemente em segurança. Em 2024, o orçamento em tecnologia alcançou quase R$ 50 bilhões, sendo 10% desse valor destinado exclusivamente à prevenção de fraudes.

O evento, que será aberto pelo presidente da Febraban, Isaac Sidney, e pelo presidente Confederação Nacional das Instituições Financeiras (CNF), Rodrigo Maia, já está com as inscrições abertas, que poderão ser feitas neste link.

O congresso acontecerá no Centro de Convenções do Distrito Anhembi, localizado no bairro de Santana, em São Paulo.

Acompanhe alguns dos temas da programação:

Estratégias da Interpol e Ameripol no enfrentamento de crimes cibernéticos e fraudes;
Avanços e desafios no combate a fraudes bancárias – Plataforma Tentáculos;
Tecnologias de combate a crimes transnacionais;
Sistemas de segurança bancária na Europa e nas Américas;
Contexto internacional de Cyber Threat Intelligence;
A evolução da segurança de dados no Brasil;
O papel da segurança bancária na estratégia nacional de combate ao crime organizado;
Inteligência Artificial aplicada à prevenção de fraudes.

Veja AQUI como fazer sua inscrição

Distrito Anhembi – Centro de convenções Av. Olavo Fontoura 1209, Santana – São Paulo – SP

Compartilhe:

Hora

março 11 (Terça) - 12 (Quarta)

Localização

Distrito Anhembi - Centro de convenções

Av. Olavo Fontoura 1209

Distrito Anhembi - Centro de convençõesAv. Olavo Fontoura 1209Santana

Calendário GoogleCal

12mar13:5213:52Identity Week Europe 2025!13:52 - 13:52

24mar(mar 24)08:1025(mar 25)18:00ERP Summit 2025A inteligência do software como fator de mudança na gestão dos negócios08:10 - 18:00 (25) EXPO Center Norte, Rua José Bernardo Pinto, 333 - Vila Guilherme - Pavilhão Azul

Mais

Detalhes do evento

Participe do ERP Summit 2025, o maior evento de software e gestão empresarial da América Latina, que acontecerá nos dias 24 e 25 de março de 2025, no Expo Center Norte, Pavilão Azul em São Paulo.

Este evento reunirá os principais líderes, especialistas e empresas do setor para discutir as tendências e inovações no mercado de ERP.

Nesta edição, o ERP Summit contará com uma programação repleta de 80 palestras, painéis e workshops, abordando temas como transformação digital, inteligência artificial, cibersegurança e muito mais. Além disso, os participantes terão a oportunidade de fazer networking e trocar experiências com profissionais renomados.

Sobre o Grupo Portal ERP

O Grupo Portal ERP se firmou como uma autoridade no cenário de software de gestão empresarial no Brasil e na América Latina. Sua atuação se destaca pela organização do maior evento sobre Software e Gestão nas Américas: o ERP Summit. Com edições realizadas em diversos países, como Brasil, Colômbia, México, Chile, Espanha e Peru, o evento se consolida como referência no setor.

A missão do Grupo Portal ERP é clara: promover o aumento da produtividade das empresas por meio do uso estratégico de sistemas de gestão.

Fundadores

Marcelo Sinhorini e Luciano Itamar lideram o Grupo Portal ERP, compartilhando o compromisso de impulsionar o sucesso das empresas através da tecnologia.

O ERP Summit 2025 terá o apoio de importantes patrocinadores,

Estamos orgulhosos de destacar o Crypto ID como um dos principais apoiadores de mídia deste evento imperdível.

Não perca essa oportunidade de se atualizar e se conectar com os principais players do mercado de ERP.

Garanta já a sua inscrição no ERP Summit 2025!

Destaques da Programação do Primeiro Dia

Abertura do Evento

Apresentação: Carolina Rodrigues, jornalista e cerimonialista com 24 anos de experiência em mídia e eventos, 9 prêmios de jornalismo e projetos personalizados de conteúdo.

Palestras Magnas

”Cenário geopolítico, Trump e IA: como isso impacta os negócios”
- Palestrante: Gabriela Prioli, advogada, comentarista política e professora, premiada como Influenciadora Digital.
“TechShow – Futuro, Tendências e demonstrações ao vivo de novas tecnologias”
- Palestrante: Tony Ventura, especialista em tecnologia, palestrante internacional e referência em novas tecnologias e growth hacking.
Panorama mundial do mercado de software
- Palestrante: Marcelo Sinhorini, CEO do Grupo Portal ERP.

Mesa Redonda Principal

“A inteligência do software como fator de mudança na gestão dos negócios”
- Participantes: Luciano Itamar (Publisher e Co-Founder do Grupo Portal ERP) e outros especialistas.

Palestra de Encerramento

Uma palestra inspiradora para encerrar o primeiro dia do evento.

Para conferir a programação completa do evento, acesse o link abaixo

https://erpsummit.com.br/#palestrantes

E muito mais!

Ao longo do dia, os congressistas poderão participar de diversas atividades em palcos e arenas dedicadas a diferentes temas:

Palco Full: Temas variados e relevantes para o mundo dos negócios.
Palco Gestão: Focado em estratégias e ferramentas para gestores de sucesso.
Palco Software: Novidades e tendências do mercado de software.
Palco Gente: Desenvolvimento de pessoas e liderança.
Arenas OlivIA, Experience X, Earth, Forest, Cloud, Fire: Imersão em tecnologias e soluções inovadoras.
Arena SAP B1 Experience: Espaço dedicado a usuários e especialistas em SAP B1.
Palcos CRM Square e DATA Village: Foco em CRM e análise de dados.

Quem vai se beneficiar com as palestras?

C-Levels: Soluções inovadoras e histórias de sucesso para transformar seus negócios.
Diretores: Ferramentas e talentos para impulsionar a vantagem competitiva da sua empresa.
IT Managers: Conhecimento de ponta e inovações para agregar valor à sua carreira.

Prepare-se para uma experiência transformadora!

Compartilhe:

Hora

24 (Segunda) 08:10 - 25 (Terça) 18:00

Localização

EXPO Center Norte

Rua José Bernardo Pinto, 333 - Vila Guilherme - Pavilhão Azul

Organizador

Portal ERP Sede Av. Antonio Artioli, 570, Condomínio Swiss Park Office, Edifício Flims B2, sala 223, 13049-900, Campinas | SP | Brasi +55 (19) 3277-0222 | (11) 3170-3273 |

Calendário GoogleCal

Oracle Cloud Infrastructure Expands NVIDIA GPU-Accelerated Instances for AI, Digital Twins and More

NVIDIA L40S Now Available to Order on OCI

Single-GPU H100 VMs Coming Soon on OCI

GH200 Bare-Metal Instances Available for Validation

Optimized Software for Enterprise AI

ÚLTIMAS NOTÍCIAS

Receba novidades

Eventos

Detalhes do evento

Detalhes do evento

Hora

Localização

Detalhes do evento

Detalhes do evento

Hora

Detalhes do evento

Detalhes do evento

Sobre o Grupo Portal ERP

Fundadores

Destaques da Programação do Primeiro Dia

Abertura do Evento

Palestras Magnas

Mesa Redonda Principal

Palestra de Encerramento

Para conferir a programação completa do evento, acesse o link abaixo

E muito mais!

Quem vai se beneficiar com as palestras?

Hora

Localização

Organizador

CADASTRE-SE EM NOSSA NEWSLETTER