EconomyFeaturedNewsTop Stories

DeepSeek lança IA que supera o DALL-E 3 em geração de imagens

A DeepSeek, empresa de IA que recentemente ganhou destaque com seu chatbot, surpreendeu o mundo da tecnologia novamente com o lançamento do Janus-Pro, uma nova família de modelos de IA multimodais capazes de analisar e gerar imagens.

Segundo a empresa, a novidade pode superar o DALL-E 3 da OpenAI em alguns testes.

O que é e como funciona o Janus-Pro da DeepSeek?

O Janus-Pro é um novo modelo de inteligência artificial (IA) multimodal, desenvolvido pela DeepSeek, capaz de analisar e criar imagens. Ele se destaca por sua arquitetura inovadora, chamada de “estrutura autorregressiva”, e por sua capacidade de superar modelos de IA renomados, como o DALL-E 3 da OpenAI, em benchmarks de avaliação.

O Janus-Pro funciona assim: ele aprende a interpretar e gerar imagens a partir de um conjunto massivo de dados. Sua “estrutura autorregressiva” permite processar informações sequencialmente, construindo a imagem passo a passo, como se estivesse “pintando” cada pixel em sequência.

Isso o torna mais eficiente na geração de imagens complexas e mais detalhadas, por exemplo.

Arquitetura inovadora o torna uma ferramenta poderosa para desenvolvedores, artistas e pesquisadores, abrindo novas possibilidades para a criação e análise de conteúdo visual.. (Imagem: DeepSeek)

Principais características

Multimodal: consegue processar diferentes tipos de dados, como imagens e texto, de forma integrada. Isso permite que ele compreenda o contexto e gere resultados mais relevantes.

Eficiente: apresenta alto desempenho mesmo com um número menor de parâmetros em comparação com outros modelos, tornando-o mais leve e rápido.

Flexível: pode ser usado para diversas tarefas, desde a geração de imagens a partir de descrições textuais até a análise e edição de imagens existentes.

Código aberto: está disponível para download na plataforma Hugging Face sob a licença MIT, permitindo que desenvolvedores e pesquisadores o utilizem e modifiquem livremente.

O Janus-Pro está disponível em diferentes tamanhos, variando de 1 bilhão a 7 bilhões de parâmetros. Essa variedade permite que os usuários escolham o modelo mais adequado às suas necessidades, dependendo da complexidade da tarefa. Essa característica, coloca o Janus-Pro-7B, o maior da família, à frente de concorrentes como DALL-E 3, PixArt-alpha, Emu3-Gen e Stable Diffusion XL em testes como o GenEval e o DPG-Bench.

O Janus-Pro está disponível em diferentes tamanhos, variando de 1 bilhão a 7 bilhões de parâmetros.(Imagem: Mojahid Mottakin/Shutterstock)

As aplicações são vastas e abrangem diversas áreas, como:

Criação de conteúdo visual: geração de imagens originais para diferentes fins, como publicidade, design, jogos e arte digital.

Edição de imagens: aprimoramento e manipulação de imagens existentes, como restauração de fotos antigas, remoção de objetos e aplicação de filtros.

Análise de imagens: extração de informações relevantes de imagens, como reconhecimento de objetos, detecção de emoções e classificação de conteúdo.

Leia mais:

DeepSeek: Assistente de IA é alvo de ciberataque; empresa suspende cadastros

DeepSeek: conheça a IA chinesa que está desafiando o ChatGPT

ChatGPT, Gemini e Copilot: 8 tarefas que ficam mais fáceis quando usamos a inteligência artificial

Vale lembrar que a DeepSeek, um laboratório chinês de IA financiado pela High-Flyer Capital Management, chamou a atenção do público recentemente quando seu aplicativo de chatbot alcançou o topo da App Store.

O lançamento do Janus-Pro reforça a posição da DeepSeek como um player importante no cenário da IA, impulsionando a inovação e desafiando os líderes já estabelecidos. A acessibilidade dos modelos e sua performance promissora abrem um leque de possibilidades para desenvolvedores e pesquisadores.

O post DeepSeek lança IA que supera o DALL-E 3 em geração de imagens apareceu primeiro em Olhar Digital.

Facebook Comments Box