O Pin Humane AI foi perdido na tradução

De todas as coisas que o Humane AI Pin prometeu, fiquei mais intrigado com a tradução. Em uma demonstração, um homem fala com o cofundador da Humane, Imran Chaudhri, em espanhol. O AI Pin traduz automaticamente para o inglês. Chaudhri responde em inglês. Mais uma vez, o AI Pin traduz suas palavras de volta para o espanhol. Há pausas notáveis ​​quando a IA está processando, mas é um conceito poderoso. Ao contrário do Google Translate, houve contato visual sólido entre as duas pessoas. A voz da IA ​​​​soou mais natural e menos robótica. E o mais importante: não havia telas. A barreira linguística ainda existia, mas era muito mais permeável.

Não foi isso que aconteceu quando eu mesmo tentei.

Falei algumas frases simples em japonês e coreano. Em vez de traduzir, o AI Pin vomitou algo sem sentido para mim. Perguntei ao meu colega David Pierce, que revisou a maldita coisa, se eu estava fazendo algo errado. Eu não estava. Simplesmente não funcionou.

Toda a experiência foi engraçada. Parecia uma vingança pelo sangue, suor e lágrimas que derramei em duas décadas de estudo de línguas estrangeiras. Mas quando assisti novamente à demonstração de tradução do Humane, meu coração se partiu. Eu me peguei desejando ter algo assim quando meus pais estavam morrendo.

Viver em uma família de imigrantes e multilíngue abrirá seus olhos para todas as maneiras pelas quais os humanos podem se entender mal. Minha história não é única, mas cresci incapaz de me comunicar no “idioma padrão” da minha família. Fui proibido de falar coreano quando criança. Meus pais eram fluentes em inglês falado e escrito, mas seu sotaque muitas vezes fazia com que se sentissem indesejados na América. Eles não queriam isso para mim, então cresci com um inglês perfeito e sem sotaque. Eu conseguia entender coreano e, quando criança, falava um pouco. Mas eventualmente, perdi essa habilidade.

Eu me tornei a família Chewbacca. A família falava comigo em coreano, eu respondia em inglês – e vice-versa. Mais tarde, comecei a aprender japonês porque era isso que a escola pública oferecia e meus avós eram fluentes. Por fim, minha família tornou-se especialista em falar um pidgin de inglês, coreano e japonês.

Esse arranjo não era nada ideal, mas viável. Isso até que meus pais foram diagnosticados com doenças neurológicas degenerativas e incuráveis. Meu pai tinha doença de Parkinson e doença de Alzheimer. Minha mãe tinha esclerose lateral amiotrófica bulbar (ELA) e demência frontotemporal (DFT). O inglês deles, uma língua que estudaram durante décadas, evaporou.

Isso tornou tudo duas vezes mais complicado. Compartilhei tarefas de cuidado com parentes que não falavam inglês. As consultas médicas – tanto aqui como na Coreia – tinham de ser bilingues, o que muitas vezes significava que as consultas eram mais longas, mais stressantes, caras e cheias de mal-entendidos. Muitas vezes, eu gostaria de me conectar com minha madrasta ou tia, tanto para coordenar os cuidados quanto para desabafar sobre coisas que só nós poderíamos entender. Nenhum de nós poderia ir além de “estou triste”, “eu venho na segunda, você vai na terça” ou “sinto muito”. Lutamos sozinhos, juntos.

Se os recursos de tradução do Humane AI Pin funcionassem conforme demonstrado, quanta dor e solidão poderiam ter sido poupadas? Nosso fardo teria parecido um pouco mais leve? Continuei repassando essas fantasias em minha cabeça desde que assisti novamente à demo. E sei que, num futuro próximo, continuará a ser uma fantasia.

A tradução em tempo real é muito difícil por vários motivos. Alguns podem estar além da capacidade atual de correção da Humane.
Foto de Amelia Holowaty Krales / The Verge

Já existem versões melhores da tecnologia de tradução da Humane. O Google Translate requer telas, mas é uma ferramenta amplamente conhecida que pode atuar como intérprete digital. Mesmo assim, o Google Translate ainda luta para acompanhar todas as formas como a linguagem evolui. Agora ele sabe que “ㅋㅋ” é como os coreanos enviam mensagens haha, mas ele se atrapalha completamente com a expressão japonesa tsutsumotase. O que você obtém é uma tradução direta, mas incorreta, dos caracteres, juntamente com uma definição aproximada. (A palavra refere-se a um tipo específico de jogo de texugo em que um homem e uma mulher se unem para extorquir financeiramente outro homem.) Sem mencionar que o inglês pode ser a língua franca que une a tecnologia, mas alguns idiomas são mais fáceis de traduzir do que outros. Pode muito bem ser que a Humane tenha optado por demos em espanhol e francês porque são muito mais relacionadas ao inglês. Talvez simplesmente não tivesse os mesmos recursos para realmente construir todos as línguas do mundo – e as inúmeras permutações que isso implicaria.

Tsutsutase não significa agência de beleza. A pessoa confiante chega perto do significado, mas falta a nuance real da frase.
Captura de tela: Victoria Song / The Verge

Mas esses são os detalhes mais sutis de domínio e fluência. Você precisa de muito menos para “sobreviver” em outro idioma. É aí que o Google Tradutor se destaca. É útil quando você está viajando e precisa de ajuda básica, como instruções ou pedido de comida. Mas a vida é vivida em momentos mais complicados do que simples transações com estranhos. Quando decidi tirar a máscara de oxigênio da minha mãe – a única máquina que a mantinha viva – usei meu pidgin de baixa qualidade para dizer à minha família que era hora de dizer adeus. Eu nunca poderia ter usado o Google Tradutor para isso. Todos nós sofremos quando minha mãe faleceu, pacificamente, em sua sala de estar. Meu coreano limitado apenas significava que eu não poderia participar de grande parte do conforto comunitário. Eu teria realmente batido em um alfinete em um momento tão pesado para entender o que minha tia estava chorando quando eu soube o porquê?

A tradução é uma arte, e a arte é algo que a IA muitas vezes erra

A tradução é uma arte, e a arte é algo que a IA muitas vezes erra. Não basta cuspir um significado direto. Para idiomas de alto contexto, como japonês e coreano, você também precisa ser capaz de traduzir o que não é dito – como o tom e as relações entre os falantes – para realmente entender o que está sendo transmitido. Se um coreano perguntar sua idade, ele não está sendo rude. Literalmente determina como eles devem falar com você. Em japonês, a palavra daijoubu pode significar “Tudo bem”, “Você está bem?” “Estou bem”, “Sim”, “Não, obrigado”, “Tudo vai ficar bem” e “Não se preocupe”, dependendo de como for dito. (Veja: esta bola de arroz explicando isso.) É confuso o suficiente para os humanos acertarem – como os dispositivos de tradução de IA treinados por humanos imperfeitos deveriam fazer isso?

Mesmo assim, não posso deixar de ansiar pela futura demonstração do Humane. Posso estudar japonês e coreano pelo resto da minha vida – e estudarei – mas sempre haverá lacunas. Tenho inúmeras lembranças de momentos em que esqueci como falar minha segunda e terceira línguas. Momentos em que eu estava com dores físicas, nervoso ou tive que fazer contas. (Garanto que todo mundo faz matemática em sua língua nativa.) Nesses momentos, seria bom ter uma maneira simples e fácil de pedir ajuda. E para ser compreendido.

Relacionado:

theverge