O que é o OpenAI DALLE 2, Midjourney, Craiyon, Imagen, e outras IA generativas?

Gerar boas imagens é difícil, utilizar https://phraser.tech.

Denis Shilov
Phraser
3 min readAug 11, 2022

--

Desde há algum tempo, a inteligência artificial tem sido utilizada para restaurar fotografias rasgadas e riscadas e colorir imagens a preto-e-branco. Outro avanço maior está a acontecer agora, as imagens geradas por IA.

Todas estas imagens são criadas por DALLE 2

Estas imagens são criadas por uma rede neural. Para treinar a rede neural, são-lhe dados inúmeros pares de imagens e as suas descrições. Após o treino, a IA reconhece uma ligação entre os objectos na imagem e as palavras. Como a maioria das aplicações da aprendizagem mecânica, as imagens geradas por IA tornam-se cada vez mais úteis. Por exemplo, a DALL-E 2 AI gerou uma imagem para a capa do *Cosmopolitan*.

Uma vez que as redes neurais aprendem a associar imagens a palavras, as suas palavras de entrada também. Os utilizadores não precisam de codificar para criar uma imagem. Apenas precisam de escrever uma mensagem — uma descrição da imagem.

Um exemplo da rapidez

Esta é uma forma mais simples, mas tem as suas limitações. Por exemplo, adicionar ‘4k full HD ao prompt melhora a qualidade da imagem porque a IA associa estas palavras a imagens de alta qualidade. Isto não é algo que se esperaria de uma rede neural, e não há maneira de saber isso logo desde o início.

As redes neurais de última geração podem imitar os estilos de um determinado artista — se acrescentar palavras apropriadas à prontidão. Desta forma, cria uma pintura *a la Degas* ou uma fotografia como a de Andy Warhol. Isto também funciona com estilos de arte em geral. Mas ainda é preciso reconhecer estes artistas e estilos para se poder colocar os seus nomes no prompt.

“Uma imagem de um robô de Salvador Dali” vs “Uma imagem de um robô de Pablo Picasso”

Outros aspectos da prontidão, como a ortografia ou o nível de detalhes na descrição, influenciam a imagem final. Qualquer coisa pode fazer a diferença. Por exemplo, se quiser gerar uma boa fotografia, poderá mencionar ‘iluminação de estúdio’ no prompt. Mas ainda precisa de compreender todas estas coisas!

Há uma forma de escrever melhor os avisos — Phraser. É uma aplicação que o ajuda a escrever avisos adaptados para os seus propósitos, bem como para diferentes redes neurais (DALL-E 2, Midjourney, Craiyon, Imagen, e assim por diante).

O Phraser divide o processo de criação de uma boa solicitação num conjunto de pequenos passos — escolha do tipo de conteúdo, estilo, sentimento, época, qualidade, e assim por diante.

Uma captura de ecrã de Phraser UI

Utiliza o ML para lhe recomendar artistas ou estilos particulares que possa gostar, com base nos seus gostos pessoais.

Uma captura de ecrã de Phraser UI

É difícil criar uma boa prontidão, mas o Phraser torna este processo muito mais fácil!

--

--