Ainda estou tentando gerar um homem asiático e uma mulher branca com IA

Eu inadvertidamente me encontrei na derrota do povo asiático gerada por IA na semana passada. Na quarta-feira passada, descobri que o gerador de imagens de IA do Meta integrado às mensagens do Instagram falhou completamente na criação de uma imagem de um homem asiático e uma mulher branca usando instruções gerais. Em vez disso, mudou sempre a raça da mulher para asiática.

No dia seguinte, tentei as mesmas solicitações novamente e descobri que o Meta parecia ter bloqueado solicitações com palavras-chave como “homem asiático” ou “homem afro-americano”. Pouco depois de perguntar ao Meta sobre isso, as imagens estavam disponíveis novamente – mas ainda com o problema de troca de raça do dia anterior.

Entendo que você esteja um pouco cansado de ler meus artigos sobre esse fenômeno. Escrever três histórias sobre isso pode ser um pouco excessivo; Eu particularmente não gosto de ter dezenas e dezenas de capturas de tela de asiáticos sintéticos em meu telefone.

Mas há algo esquisito acontecendo aqui, onde vários geradores de imagens de IA lutam especificamente com a combinação de homens asiáticos e mulheres brancas. É a notícia mais importante do dia? Não por um tiro longo. Mas as mesmas empresas que dizem ao público que “a IA está a permitir novas formas de ligação e expressão” também deveriam estar dispostas a oferecer uma explicação quando os seus sistemas são incapazes de lidar com consultas de toda uma raça de pessoas.

Após cada uma das histórias, os leitores compartilharam seus próprios resultados usando instruções semelhantes com outros modelos. Eu não estava sozinho em minha experiência: pessoas relataram ter recebido mensagens de erro semelhantes ou ter modelos de IA trocando raças consistentemente.

Eu me juntei com A beiraEmilia David para gerar alguns asiáticos de IA em múltiplas plataformas. Os resultados só podem ser descritos como consistentemente inconsistentes.

Google Gêmeos

Captura de tela: Emilia David / The Verge

Gêmeos recusou-se a gerar homens asiáticos, mulheres brancas ou humanos de qualquer tipo.

No final de fevereiro, o Google interrompeu a capacidade do Gemini de gerar imagens de pessoas depois que seu gerador – no que parecia ser uma tentativa equivocada de representação diversificada na mídia – cuspiu imagens de nazistas racialmente diversos. A geração de imagens de Gêmeos deveria retornar em março, mas aparentemente ainda está offline.

Entretanto, Gêmeos é capaz de gerar imagens sem pessoas!

Nenhum casal inter-racial nessas fotos geradas por IA.

Captura de tela: Emilia David / The Verge

O Google não respondeu a um pedido de comentário.

DALL-E

O DALL-E 3 do ChatGPT lutou com a pergunta “Você pode me tirar uma foto de um homem asiático e uma mulher branca?” Não foi exatamente uma falha, mas também não acertou em cheio. Claro, raça é uma construção social, mas digamos apenas que essa imagem não é o que você pensava que iria conseguir, não é?

Perguntamos: “Você pode me fazer uma foto de um homem asiático e uma mulher branca” e obtivemos um “mais ou menos” firme.

Imagem: Emilia David/The Verge

OpenAI não respondeu a um pedido de comentário.

Meio da jornada

Midjourney teve dificuldades semelhantes. Novamente, não foi uma falha total como o gerador de imagens do Meta foi na semana passada, mas estava claramente tendo dificuldades com a tarefa, gerando alguns resultados profundamente confusos. Nenhum de nós consegue explicar essa última imagem, por exemplo. Todas as opções abaixo foram respostas ao prompt “homem asiático e esposa branca”.

Imagem: Emilia David/The Verge

Imagem: Cath Virginia / The Verge

Midjourney finalmente nos deu algumas imagens que foram a melhor tentativa em três plataformas diferentes – Meta, DALL-E e Midjourney – de representar uma mulher branca e um homem asiático em um relacionamento. Finalmente, uma subversão das normas sociais racistas!

Infelizmente, a forma como chegamos lá foi através do aviso “homem asiático e mulher branca em um ambiente acadêmico no quintal”.

Imagem: Emilia David/The Verge

O que significa que a forma mais consistente pela qual a IA pode contemplar este emparelhamento inter-racial específico é colocá-lo num contexto académico? Que tipo de preconceitos são incorporados aos conjuntos de treinamento para nos levar a este ponto? Quanto tempo mais terei que evitar fazer uma piada extremamente medíocre sobre namoro na NYU?

Midjourney não respondeu a um pedido de comentário.

Meta AI via Instagram (de novo)

De volta à velha rotina de tentar fazer com que o gerador de imagens do Instagram reconhecesse homens não-brancos com mulheres brancas! Parece estar funcionando muito melhor com instruções como “mulher branca e marido asiático” ou “homem asiático-americano e amigo branco” – não repetia os mesmos erros que encontrei na semana passada.

No entanto, agora está lutando com mensagens de texto como “Homem negro e namorada caucasiana” e gerando imagens de duas pessoas negras. Foi mais preciso usar “mulher branca e marido negro”, então acho que só às vezes não vê raça?

Capturas de tela: Mia Sato / The Verge

Existem certos tiques que começam a ficar aparentes quanto mais você gera imagens. Alguns parecem benignos, como o fato de que muitas mulheres de IA de todas as raças aparentemente usam o mesmo vestido floral branco sem mangas que cruza no busto. Geralmente há flores cercando os casais (os namorados asiáticos geralmente vêm com flores de cerejeira) e ninguém parece ter mais de 35 anos. Outros padrões entre as imagens parecem mais reveladores: todos são magros e os homens negros, especificamente, são retratados como musculosos. As mulheres brancas são loiras ou ruivas e quase nunca morenas. Os homens negros sempre têm pele profunda.

“Como dissemos quando lançamos esses novos recursos em setembro, esta é uma tecnologia nova e nem sempre será perfeita, o que é o mesmo para todos os sistemas generativos de IA”, disse Tracy Clayton, porta-voz da Meta. A beira em um e-mail. “Desde o lançamento, lançamos constantemente atualizações e melhorias em nossos modelos e continuamos trabalhando para torná-los melhores.”

Eu gostaria de ter alguns insights profundos para transmitir aqui. Mas, mais uma vez, vou apenas salientar o quão ridículo é que esses sistemas estejam lutando com instruções bastante simples, sem depender de estereótipos ou serem incapazes de criar algo todos juntos. Em vez de explicar o que está acontecendo de errado, tivemos silêncio no rádio por parte de empresas ou generalidades. Peço desculpas a todos que se preocupam com isso – vou voltar ao meu trabalho normal agora.

theverge