O Google não comentará sobre um vazamento potencialmente massivo da documentação de seu algoritmo de busca

O algoritmo de busca do Google é talvez o sistema de maior importância na internet, ditando quais sites vivem e morrem e qual é a aparência do conteúdo da web. Mas a forma exata como o Google classifica os sites tem sido um mistério, desvendado por jornalistas, pesquisadores e pessoas que trabalham com otimização de mecanismos de busca.

Agora, um vazamento explosivo que pretende mostrar milhares de páginas de documentos internos parece oferecer uma visão sem precedentes de como a Pesquisa funciona – e sugere que o Google não tem sido totalmente sincero sobre isso há anos. Até agora, o Google não respondeu a vários pedidos de comentários sobre a legitimidade dos documentos.

Rand Fishkin, que trabalhou com SEO por mais de uma década, diz que uma fonte compartilhou 2.500 páginas de documentos com ele na esperança de que a reportagem sobre o vazamento contrariasse as “mentiras” que os funcionários do Google compartilharam sobre como funciona o algoritmo de busca. Os documentos descrevem a API de busca do Google e detalham quais informações estão disponíveis aos funcionários, de acordo com Fishkin.

Os detalhes compartilhados por Fishkin são densos e técnicos, provavelmente mais legíveis para desenvolvedores e especialistas em SEO do que para leigos. O conteúdo do vazamento também não é necessariamente uma prova de que o Google usa os dados e sinais específicos que menciona para classificações de pesquisa. Em vez disso, o vazamento descreve quais dados o Google coleta de páginas da web, sites e pesquisadores e oferece dicas indiretas aos especialistas em SEO sobre o que o Google parece se importar, como escreveu o especialista em SEO Mike King em sua visão geral dos documentos.

Os documentos vazados abordam tópicos como que tipo de dados o Google coleta e usa, quais sites o Google eleva para tópicos delicados como eleições, como o Google lida com pequenos sites e muito mais. Algumas informações nos documentos parecem estar em conflito com declarações públicas de representantes do Google, segundo Fishkin e King.

“’Lied’ é duro, mas é a única palavra correta a ser usada aqui”, escreve King. “Embora eu não culpe necessariamente os representantes públicos do Google por protegerem suas informações proprietárias, discordo de seus esforços para desacreditar ativamente as pessoas nos mundos do marketing, da tecnologia e do jornalismo que apresentaram descobertas reproduzíveis.”

O Google não respondeu a A beira’s pedidos de comentários relativamente aos documentos, incluindo um pedido direto para refutar a sua legitimidade. Fishkin disse A beira em e-mail que a empresa não contestou a veracidade do vazamento, mas que um funcionário pediu que ele mudasse alguma linguagem da postagem a respeito de como um evento foi caracterizado.

O algoritmo de busca secreto do Google deu origem a toda uma indústria de profissionais de marketing que seguem de perto as orientações públicas do Google e as executam para milhões de empresas em todo o mundo. As táticas generalizadas e muitas vezes irritantes levaram a uma narrativa geral de que os resultados da Pesquisa Google estão piorando, repletos de lixo que os operadores de sites sentem-se obrigados a produzir para que seus sites sejam vistos. Em resposta a A beiraEm relatórios anteriores sobre táticas orientadas para SEO, os representantes do Google muitas vezes recorrem a uma defesa familiar: não é isso que dizem as diretrizes do Google.

Mas alguns detalhes nos documentos vazados questionam a precisão das declarações públicas do Google sobre como funciona a Pesquisa.

Um exemplo citado por Fishkin e King é se os dados do Google Chrome são usados ​​na classificação. Os representantes do Google indicaram repetidamente que não usa dados do Chrome para classificar as páginas, mas o Chrome é mencionado especificamente nas seções sobre como os sites aparecem na Pesquisa. Na captura de tela abaixo, que capturei como exemplo, os links que aparecem abaixo do URL principal do vogue.com podem ser criados em parte usando dados do Chrome, de acordo com os documentos.

O Chrome é mencionado em uma seção sobre como links adicionais são criados.
Imagem: Google

Outra questão levantada é qual o papel, se houver, que o EEAT desempenha na classificação. EEAT significa experiência, conhecimento, autoridade e confiabilidade, uma métrica do Google usada para avaliar a qualidade dos resultados. Os representantes do Google disseram anteriormente que o EEAT não é um fator de classificação. Fishkin observa que não encontrou muita coisa nos documentos que mencionem o nome do EEAT.

King, no entanto, detalhou como o Google parece coletar dados do autor de uma página e tem um campo para saber se uma entidade na página é o autor. Uma parte dos documentos compartilhados por King diz que o campo foi “desenvolvido e ajustado principalmente para artigos de notícias… mas também é preenchido para outros conteúdos (por exemplo, artigos científicos)”. Embora isso não confirme que as assinaturas sejam uma métrica de classificação explícita, mostra que o Google está pelo menos acompanhando esse atributo. Os representantes do Google já haviam insistido que as assinaturas dos autores são algo que os proprietários de sites deveriam fazer para os leitores, não para o Google, porque isso não afeta as classificações.

Embora os documentos não sejam exatamente uma arma fumegante, eles fornecem uma visão profunda e sem filtros de um sistema de caixa preta bem guardado. O caso antitruste do governo dos EUA contra o Google – que gira em torno da Pesquisa – também fez com que a documentação interna se tornasse pública, oferecendo mais informações sobre como funciona o principal produto da empresa.

A cautela geral do Google sobre como a Pesquisa funciona fez com que os sites parecessem iguais aos que os profissionais de marketing de SEO tentam enganar o Google com base nas dicas que a empresa oferece. Fishkin também chama a atenção das publicações que apoiam credulamente as afirmações públicas do Google como verdadeiras, sem muita análise mais aprofundada.

“Historicamente, algumas das vozes mais altas da indústria de buscas e os editores mais prolíficos têm ficado felizes em repetir acriticamente as declarações públicas do Google. Eles escrevem manchetes como “Google diz que XYZ é verdade”, em vez de “Google afirma XYZ; As evidências sugerem o contrário’”, escreve Fishkin. “Por favor, faça melhor. Se esse vazamento e o julgamento do DOJ puderem criar apenas uma mudança, espero que seja isso.”

theverge