IA da DeepSeek estaria rodando em GPUs Ascend 910C, da Huawei
A DeepSeek provavelmente continuará sendo o grande assunto da semana para o segmento de IA. Depois de levar os créditos por fazer despencar as ações de grandes empresas de tecnologia, agora a empresa da China volta às notícias pelo hardware que está usando para inferência em seu modelo R1. Aparentemente, a companhia está usando chips Ascend 910C, de sua conterrânea Huawei.
As informações vêm de Alexander Doria, especialista na tecnologia de modelos grandes de linguagem (LLM). Ele afirma que a DeepSeek teria usado chips NVIDIA H800 para treinar seu modelo R1 de IA, mas que agora a inferência é computada por placas Ascend 910C, da Huawei. Doria acrescenta ainda o comentário de que isso deveria estar mais em evidência.
Fonte: Alexander Doria
A Huawei afirma que seu acelerador Ascend 910C seria capaz de rivalizar com a H100 da NVIDIA. A produção em larga escala da GPU estaria estimada para o primeiro trimestre de 2025, o que indica um acesso antecipado às placas para o pessoal da DeepSeek.
Enquanto a empresa chinesa admite que treinou seu modelo em hardware da NVIDIA, usar GPUs domésticas para sua inferência deve diminuir muito os custos para oferecer o serviço. Além disso, é mais um ponto para a autonomia que a China tenta promover enquanto enfrenta sanções comerciais crescentes dos EUA e seus aliados.
Sucesso da DeepSeek gera questionamentos
Há controvérsias a respeito do desenvolvimento da IA que “chegou do nada” e abalou o mercado internacional da tecnologia. Enquanto a DeepSeek afirma que desenvolveu seu modelo com investimento menor que US$ 6 milhões usando recursos limitados, muitos especialistas do ocidente questionam essas afirmações.
Notícias relacionadas:
NVIDIA perde US$ 600 bilhões de valor de mercado com sucesso de IA chinesa
IA da chinesa DeepSeek derruba ações de big techs: NVIDIA caiu 11%
Huawei diz que seu novo chip para IA compete com H100 da Nvidia
Críticos da empresa dizem que o custo relatado não deve se referir ao preço total do treinamento e criação da tecnologia, mas apenas quanto custa seu modelo final, pronto. Além disso, há especulações de que a empresa conta com milhares de placas NVIDIA H100, algo que nunca será confirmado oficialmente porque essas GPUs não podem ser legalmente exportadas para a China.
Porém, os mais críticos ainda concordam que a DeepSeek provavelmente conseguiu criar e oferecer sua tecnologia com investimento bem menor do que as concorrentes que ela consegue enfrentar atualmente. E é isso que tem abalado o mercado financeiro.
Via: WCCFTech