A OpenAI anunciou nesta terça-feira (25) o novo modelo 4o para geração de imagens, já integrado ao ChatGPT. A novidade produz resultados mais realistas e se destaca por conseguir renderizar e colocar textos legíveis nas criações.
- Como criar imagem no ChatGPT | Guia Prático
- Como saber se o ChatGPT está fora do ar
O uso de texto em imagens geradas por IA sempre foi um fator crítico: modelos de diferentes empresas tinham dificuldade de reproduzir todas as letras e deixavam distorções no meio do caminho. “O resultado é uma geração de imagem que não é apenas bonita, mas também é útil”, informou a criadora do ChatGPT em nota.
Saiba mais sobre a nova IA:
–
Entre no Canal do WhatsApp do e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–
- O que o novo modelo consegue fazer?
- Limitações
- Disponibilidade
O que o novo modelo consegue fazer?
O modelo 4o está mais capaz de entender o contexto dos prompts, segundo a empresa, o que permite criar imagens com textos ou ricas em detalhes. O nível de realismo está mais alto (as mãos humanas deixaram de ser um problema para a IA generativa há um tempo) e existem mais opções para refinar uma criação.

Além dos textos, é possível enviar mais instruções para o modelo: o ChatGPT conseguiu criar imagens contendo 15 objetos diferentes durante uma demonstração.
No entanto, a empresa alerta que a tecnologia tem dificuldade para seguir 20 ou mais instruções no mesmo comando. Não seria possível criar uma tabela periódica ou uma lista dos times da NBA (liga de basquete dos EUA) com precisão, por exemplo.
A novidade também permite criar imagens com fundo transparente e transformá-las em adesivos que podem ser usados em outras criações. Também é possível mudar o estilo de uma criação sem perder os elementos essenciais, incluindo uma opção para modificar uma imagem já existente.

A OpenAI informa que todas as criações com o novo modelo seguem as diretrizes do C2PA (Coalition for Content Provenance and Authencity, ou “Coalizão para Proveniência e Autenticidade de Conteúdo”, em tradução livre), um padrão de marca d’água invisível para sinalizar que aquilo foi gerado por IA.
Limitações
A desenvolvedora também explicou que o modelo tem algumas limitações. Veja exemplos:
- Imagens muito compridas podem ser cortadas na parte inferior;
- O modelo pode alucinar e inventar informações incorretas, principalmente em prompts com pouco contexto;
- O modelo pode ter dificuldades para criar imagens com mais de 20 conceitos de uma só vez;
- A IA apresenta dificuldade para criar gráficos precisos;
- O modelo pode mostrar erros para renderizar caracteres que não são do alfabeto latino;
- Ajustes de áreas pequenas podem mostrar erros;
A OpenAI ainda reforçou que vai bloquear pedidos de imagens que possam violar as políticas de conteúdo da empresa, incluindo deepfakes eróticos, e aplicou restrições para criações que envolvam a aparência de pessoas reais. A empresa não comentou o uso de direitos autorais ou os materiais usados para treinamento.
Disponibilidade
O novo modelo começou a ser liberado nesta terça-feira (25) para usuários gratuitos e assinantes dos planos Plus, Pro e Team do ChatGPT. Em teste feito pelo , o chatbot ainda usou o DALL-E para gerar imagens e o 4o não estava disponível.
Leia também:
- 7 alternativas ao ChatGPT gratuitas
- Como criar um prompt certeiro no ChatGPT?
- Como saber se uma foto foi criada por Inteligência Artificial
VÍDEO: como usar o ChatGPT no WhatsApp
Leia mais matérias no ItechNews .