DestaqueEconomiaNewsPrincipais notícias

DeepSeek R2 pode ser até 97,3% mais barato do que GPT-4o e roda em chips Huawei [RUMOR]

Começam a circular os primeiros rumores para o R2, próxima geração do modelo de IA da DeepSeek. Se as informações estiverem corretas, é provável que a empresa chinesa vai abalar novamente o mercado e a bolsa de valores das big techs ocidentais.

Como sempre, rumores devem ser vistos com uma dose segura de ceticismo. Neste caso temos boatos circulando na mídia da China que começaram a ser traduzidos para os nossos lados. Aparentemente, o DeepSeek R2 consegue entregar uma performance semelhante ao GPT-4 Turbo da OpenAI, ou ao Gemini 2.0 Pro, da Google.

Captura de post falando de rumores da China
Fonte: deedydas

A parte realmente disruptiva da nova tecnologia seriam seus baixos custos. Segundo o post acima, o modelo R2 pode custar até 97,3% menos por token do que o GPT-4o para ser usado. Ainda de acordo com boatos vindos da China, a DeepSeek teria implementado uma versão avançada do MoE (Mixture of Experts), com programação avançada para conseguir o dobro de parâmetros no R2 em relação ao que o R1 oferecia, alcançando 1,2 trilhão.

Outra parte bem importante dos rumores é que o novo modelo teria alcançado 82% de utilização em aceleradores Ascend 910B. A DeepSeek já havia mostrado interesse nos aceleradores da Huawei desde o modelo R1, então faz sentido que a empresa avançaria na otimização de seus modelos para componentes de sua conterrânea. Principalmente para avançar a autonomia tecnológica da China.

Rumores sobre o DeepSeek R2
Fonte: deedydas

DeepSeek poderá aproveitar chips Ascend 920 AI em breve

Vale lembrar novamente que ainda estamos na fase dos rumores, e somente depois do anúncio oficial e um uso na prática do modelo veremos quantas informações se confirmam. O fator principal aqui é o possível baixíssimo custo do R2 para operar, o que deve torná-lo muito atrativo para clientes no mundo todo.

Notícias relacionadas:

Enquanto isso, a Huawei avança no desenvolvimento de seus aceleradores também, tendo anunciado recentemente os Ascend 920 AI. A empresa aproveitou o bloqueio de envios de GPUs H20 da NVIDIA para a China para promover seu novo produto.

Se a companhia entregar em suas promessas para seus novos chips, a DeepSeek provavelmente conseguirá rodar seus modelos apenas usando hardware nacional sem dificuldade. Isso deve reduzir ainda mais seus custos.

Via: WCCFTech

Facebook Comments Box