ChatGPT ganha nova IA para gerar imagens com textos legíveis

A OpenAI anunciou nesta terça-feira (25) o novo modelo 4o para geração de imagens, já integrado ao ChatGPT. A novidade produz resultados mais realistas e se destaca por conseguir renderizar e colocar textos legíveis nas criações.

Como criar imagem no ChatGPT | Guia Prático
Como saber se o ChatGPT está fora do ar

O uso de texto em imagens geradas por IA sempre foi um fator crítico: modelos de diferentes empresas tinham dificuldade de reproduzir todas as letras e deixavam distorções no meio do caminho. “O resultado é uma geração de imagem que não é apenas bonita, mas também é útil”, informou a criadora do ChatGPT em nota.

Saiba mais sobre a nova IA:

–
Entre no Canal do WhatsApp do e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–

O que o novo modelo consegue fazer?
Limitações
Disponibilidade

O que o novo modelo consegue fazer?

O modelo 4o está mais capaz de entender o contexto dos prompts, segundo a empresa, o que permite criar imagens com textos ou ricas em detalhes. O nível de realismo está mais alto (as mãos humanas deixaram de ser um problema para a IA generativa há um tempo) e existem mais opções para refinar uma criação.

Imagem com texto gerada pelo ChatGPT — ChatGPT consegue criar textos precisos com novo modelo (Imagem: Reprodução/OpenAI)

Além dos textos, é possível enviar mais instruções para o modelo: o ChatGPT conseguiu criar imagens contendo 15 objetos diferentes durante uma demonstração.

No entanto, a empresa alerta que a tecnologia tem dificuldade para seguir 20 ou mais instruções no mesmo comando. Não seria possível criar uma tabela periódica ou uma lista dos times da NBA (liga de basquete dos EUA) com precisão, por exemplo.

A novidade também permite criar imagens com fundo transparente e transformá-las em adesivos que podem ser usados em outras criações. Também é possível mudar o estilo de uma criação sem perder os elementos essenciais, incluindo uma opção para modificar uma imagem já existente.

Notebook com imagem gerada pelo ChatGPT — Novo modelo 4o gera imagens com fundo transparente (Imagem: Reprodução/OpenAI)

A OpenAI informa que todas as criações com o novo modelo seguem as diretrizes do C2PA (Coalition for Content Provenance and Authencity, ou “Coalizão para Proveniência e Autenticidade de Conteúdo”, em tradução livre), um padrão de marca d’água invisível para sinalizar que aquilo foi gerado por IA.

Limitações

A desenvolvedora também explicou que o modelo tem algumas limitações. Veja exemplos:

Imagens muito compridas podem ser cortadas na parte inferior;
O modelo pode alucinar e inventar informações incorretas, principalmente em prompts com pouco contexto;
O modelo pode ter dificuldades para criar imagens com mais de 20 conceitos de uma só vez;
A IA apresenta dificuldade para criar gráficos precisos;
O modelo pode mostrar erros para renderizar caracteres que não são do alfabeto latino;
Ajustes de áreas pequenas podem mostrar erros;

A OpenAI ainda reforçou que vai bloquear pedidos de imagens que possam violar as políticas de conteúdo da empresa, incluindo deepfakes eróticos, e aplicou restrições para criações que envolvam a aparência de pessoas reais. A empresa não comentou o uso de direitos autorais ou os materiais usados para treinamento.

Disponibilidade

O novo modelo começou a ser liberado nesta terça-feira (25) para usuários gratuitos e assinantes dos planos Plus, Pro e Team do ChatGPT. Em teste feito pelo , o chatbot ainda usou o DALL-E para gerar imagens e o 4o não estava disponível.

Leia também:

7 alternativas ao ChatGPT gratuitas
Como criar um prompt certeiro no ChatGPT?
Como saber se uma foto foi criada por Inteligência Artificial

VÍDEO: como usar o ChatGPT no WhatsApp

18g

ChatGPT ganha nova IA para gerar imagens com textos legíveis

O que o novo modelo consegue fazer?

Limitações

Disponibilidade

Related

Editor Picks

Deixe um comentario Cancelar comentario

ChatGPT ganha nova IA para gerar imagens com textos legíveis

O que o novo modelo consegue fazer?

Limitações

Disponibilidade

Related

Editor Picks

Rover da NASA encontra as maiores moléculas orgânicas já vistas em Marte

O que é no-code? Entenda como a prática funciona

Por que carro automático não pega no tranco?

Lollapalooza 2025: tire dúvidas sobre o app, ingresso digital, streaming e mais

RDNA 4: Guia completo com tudo sobre a nova arquitetura gráfica da AMD

O futuro dos meios de pagamentos no Brasil

Deixe um comentario Cancelar comentario