Algoritmo chinês é capaz de aumentar o desempenho de GPUs NVIDIA em até 800x para aplicações científicas
Pesquisadores da Shenzhen MSU-BIT University, uma colaboração entre a Universidade Estatal de Moscou Lomonosov e o Instituto de Tecnologia de Pequim, anunciaram um avanço significativo na otimização de simulações computacionais.
O novo algoritmo desenvolvido pela equipe liderada pela professora associada Yang Yang potencializa a teoria peridinâmica (PD), usada para modelar fraturas e danos estruturais, permitindo ganhos de desempenho de até 800 vezes em GPUs NVIDIA.
O estudo, publicado no Chinese Journal of Computational Mechanics em 8 de janeiro de 2025, detalha como a equipe utilizou a tecnologia CUDA da NVIDIApara otimizar a memória e o design do algoritmo.
Como resultado, o framework PD-General demonstrou ser 100x mais rápido que soluções baseadas em OpenMP e permitiu que simulações complexas rodassem em hardware de consumo, como a RTX 4070, dispensando supercomputadores.
Simulações de materiais mais rápidas e acessíveis
A otimização permite simulações que antes eram inviáveis devido ao alto custo computacional. Em testes de grande escala, o algoritmo realizou 4.000 iterações em cinco minutos e completou 69,85 milhões de passos em problemas 2D em menos de dois minutos.
Isso representa um avanço importante para setores que dependem de modelagem detalhada de materiais, como:
Aeroespacial e defesa: simulações aprimoradas de falhas estruturais em aeronaves;
Engenharia civil e manufatura: testes otimizados para materiais industriais e de construção;
Pesquisa militar: desenvolvimento mais rápido de materiais resistentes a impactos.
A capacidade de realizar simulações avançadas em GPUs de consumo democratiza o acesso à computação de alto desempenho, reduzindo a necessidade de clusters caros e restritos por sanções
Fonte: Getty Images
Contexto geopolítico e impacto tecnológico
O desenvolvimento ocorre em um momento estratégico, à medida que a China busca reduzir sua dependência de tecnologia ocidental em meio a sanções e restrições comerciais.
Recentemente, empresas chinesas têm investido em alternativas aos chips da NVIDIA, como o Ascend 910C, que, segundo a DeepSeek, já atinge 60% do desempenho da H100 em inferência de IA.
Além disso, a recente resposta da China às tarifas dos EUA, com restrições próprias e investigações contra empresas como Google, reforça a necessidade de soluções locais para computação de alto desempenho.
Paralelamente, autoridades americanas estariam investigando se a DeepSeek utilizou GPUs NVIDIA proibidas para a China, evidenciando as tensões tecnológicas entre os países.
O avanço no campo das simulações computacionais, portanto, pode representar um passo íngreme e potente para a independência tecnológica da China e da Rússia, possibilitando avanços sem a necessidade de hardware ocidental de última geração.
Fonte: SCMP