DeepSeek R2 pode ser até 97,3% mais barato do que GPT-4o e roda em chips Huawei [RUMOR]
Começam a circular os primeiros rumores para o R2, próxima geração do modelo de IA da DeepSeek. Se as informações estiverem corretas, é provável que a empresa chinesa vai abalar novamente o mercado e a bolsa de valores das big techs ocidentais.
Como sempre, rumores devem ser vistos com uma dose segura de ceticismo. Neste caso temos boatos circulando na mídia da China que começaram a ser traduzidos para os nossos lados. Aparentemente, o DeepSeek R2 consegue entregar uma performance semelhante ao GPT-4 Turbo da OpenAI, ou ao Gemini 2.0 Pro, da Google.

A parte realmente disruptiva da nova tecnologia seriam seus baixos custos. Segundo o post acima, o modelo R2 pode custar até 97,3% menos por token do que o GPT-4o para ser usado. Ainda de acordo com boatos vindos da China, a DeepSeek teria implementado uma versão avançada do MoE (Mixture of Experts), com programação avançada para conseguir o dobro de parâmetros no R2 em relação ao que o R1 oferecia, alcançando 1,2 trilhão.
Outra parte bem importante dos rumores é que o novo modelo teria alcançado 82% de utilização em aceleradores Ascend 910B. A DeepSeek já havia mostrado interesse nos aceleradores da Huawei desde o modelo R1, então faz sentido que a empresa avançaria na otimização de seus modelos para componentes de sua conterrânea. Principalmente para avançar a autonomia tecnológica da China.

DeepSeek poderá aproveitar chips Ascend 920 AI em breve
Vale lembrar novamente que ainda estamos na fase dos rumores, e somente depois do anúncio oficial e um uso na prática do modelo veremos quantas informações se confirmam. O fator principal aqui é o possível baixíssimo custo do R2 para operar, o que deve torná-lo muito atrativo para clientes no mundo todo.
Notícias relacionadas:
- Veja quanto cada bilionário das Big Techs perdeu com a chegada da DeepSeek
- Huawei apresenta Ascend 920 AI, aproveitando bloqueio das NVIDIA H20
- Ações da NVIDIA caem em 5% após anúncio do Huawei Ascend 920 AI
Enquanto isso, a Huawei avança no desenvolvimento de seus aceleradores também, tendo anunciado recentemente os Ascend 920 AI. A empresa aproveitou o bloqueio de envios de GPUs H20 da NVIDIA para a China para promover seu novo produto.
Se a companhia entregar em suas promessas para seus novos chips, a DeepSeek provavelmente conseguirá rodar seus modelos apenas usando hardware nacional sem dificuldade. Isso deve reduzir ainda mais seus custos.
Via: WCCFTech