DestaqueEconomiaNewsPrincipais notícias

IA da DeepSeek estaria rodando em GPUs Ascend 910C, da Huawei

A DeepSeek provavelmente continuará sendo o grande assunto da semana para o segmento de IA. Depois de levar os créditos por fazer despencar as ações de grandes empresas de tecnologia, agora a empresa da China volta às notícias pelo hardware que está usando para inferência em seu modelo R1. Aparentemente, a companhia está usando chips Ascend 910C, de sua conterrânea Huawei.

As informações vêm de Alexander Doria, especialista na tecnologia de modelos grandes de linguagem (LLM). Ele afirma que a DeepSeek teria usado chips NVIDIA H800 para treinar seu modelo R1 de IA, mas que agora a inferência é computada por placas Ascend 910C, da Huawei. Doria acrescenta ainda o comentário de que isso deveria estar mais em evidência.

Fonte: Alexander Doria

A Huawei afirma que seu acelerador Ascend 910C seria capaz de rivalizar com a H100 da NVIDIA. A produção em larga escala da GPU estaria estimada para o primeiro trimestre de 2025, o que indica um acesso antecipado às placas para o pessoal da DeepSeek.

Enquanto a empresa chinesa admite que treinou seu modelo em hardware da NVIDIA, usar GPUs domésticas para sua inferência deve diminuir muito os custos para oferecer o serviço. Além disso, é mais um ponto para a autonomia que a China tenta promover enquanto enfrenta sanções comerciais crescentes dos EUA e seus aliados.

Sucesso da DeepSeek gera questionamentos

Há controvérsias a respeito do desenvolvimento da IA que “chegou do nada” e abalou o mercado internacional da tecnologia. Enquanto a DeepSeek afirma que desenvolveu seu modelo com investimento menor que US$ 6 milhões usando recursos limitados, muitos especialistas do ocidente questionam essas afirmações.

Notícias relacionadas:

NVIDIA perde US$ 600 bilhões de valor de mercado com sucesso de IA chinesa

IA da chinesa DeepSeek derruba ações de big techs: NVIDIA caiu 11%

Huawei diz que seu novo chip para IA compete com H100 da Nvidia

Críticos da empresa dizem que o custo relatado não deve se referir ao preço total do treinamento e criação da tecnologia, mas apenas quanto custa seu modelo final, pronto. Além disso, há especulações de que a empresa conta com milhares de placas NVIDIA H100, algo que nunca será confirmado oficialmente porque essas GPUs não podem ser legalmente exportadas para a China.

Porém, os mais críticos ainda concordam que a DeepSeek provavelmente conseguiu criar e oferecer sua tecnologia com investimento bem menor do que as concorrentes que ela consegue enfrentar atualmente. E é isso que tem abalado o mercado financeiro.

Via: WCCFTech

Facebook Comments Box