Google Leak: cosa è stato scoperto
Nel maggio 2024, una fuga di documenti interni di Google ha rivelato dettagli inediti sul funzionamento degli algoritmi di ricerca del gigante tecnologico. Questi documenti, contenenti oltre 2.500 pagine di documentazione API, sembrano provenire dal “Content API Warehouse” interno di Google e illustrano 14.014 attributi (funzionalità API) utilizzati dal motore di ricerca.
Cosa c’è nei documenti trapelati
I documenti rivelano informazioni cruciali su come Google classifica i contenuti, gestisce i dati degli utenti e utilizza vari segnali per determinare il ranking delle pagine web. Ecco alcune delle principali scoperte:
- Metriche di engagement degli utenti: Google utilizza metriche come “goodClicks” e “badClicks” per valutare la qualità dell’esperienza utente su una pagina e il grado di soddisfazione degli utenti con i risultati di ricerca.
- Autorità del sito: Il concetto di “Site Authority” si riferisce all’autorità complessiva di un sito web, influenzata da fattori come la qualità dei contenuti, i link in entrata e l’engagement degli utenti.
- Siti piccoli e blog: Google potrebbe trattare in modo diverso i siti personali o blog di piccole dimensioni, utilizzando moduli o flag specifici per valutarli e classificarli.
- Età e storia del brand: Google tiene conto della storia di un dominio e del brand associato quando valuta la sua autorità e pertinenza, privilegiando i siti più vecchi e consolidati.
- Dati Chrome: Google utilizza i dati di clickstream raccolti tramite il browser Chrome per calcolare metriche che influenzano il ranking delle pagine, come il numero di clic su pagine specifiche.
- Whitelist per settori: Esistono whitelist per settori specifici come viaggi, COVID-19 e politica, per garantire che solo domini affidabili appaiano per query potenzialmente problematiche o controverse.
- Archiviazione delle versioni delle pagine: Google conserva copie di ogni versione di ogni pagina web che ha mai indicizzato, per monitorare l’evoluzione dei contenuti nel tempo.
- Feedback dei Quality Raters: I punteggi e i dati generati dai valutatori della qualità di EWOK sembrano essere direttamente coinvolti nel sistema di ricerca di Google.
- Entità: Google memorizza informazioni sugli autori associati ai contenuti e cerca di determinare se un’entità è l’autore di un documento.
- Cause di retrocessione: Google può penalizzare una pagina o un sito per vari motivi, come la presenza di link non pertinenti, segnali di insoddisfazione degli utenti, recensioni di prodotti di bassa qualità e contenuti pornografici.
- Backlink: La diversità e la rilevanza dei link in entrata sono cruciali per determinare l’autorità di una pagina. Google classifica i link in tre categorie (bassa, media, alta qualità) e utilizza i dati di clic per determinare a quale categoria appartiene un documento.
Sotto il cofano di Google Search
Il leak ha anche rivelato dettagli sorprendenti sull’architettura interna del sistema di ricerca di Google:
- Super Root: Al centro dell’enorme struttura del motore di ricerca di Google c’è un core chiamato “Super Root”, che funge da ponte tra tutti i servizi di Google e coordina le risposte alle query degli utenti.
- Twiddlers: Queste funzioni di reranking operano dopo l’algoritmo di ricerca primario, modificando il punteggio o il ranking di un documento prima di presentarlo all’utente.
- Navboost, QualityBoost, RealTimeBoost, WebImageBoost: Sono esempi di Twiddlers progettati per ottimizzare vari aspetti dei risultati di ricerca, come il ranking basato sui clic degli utenti, la qualità dei contenuti, la pertinenza in tempo reale e il posizionamento delle immagini web.
La relazione tra Chrome e la SEO
I documenti trapelati hanno rivelato dettagli sulla relazione tra il browser Chrome e la SEO, sollevando nuove questioni sull’uso dei dati di navigazione per influenzare il ranking dei risultati di ricerca. In particolare:
- Google utilizza i dati di clickstream raccolti tramite Chrome per calcolare metriche che influenzano il ranking delle pagine, come il numero di clic su pagine specifiche e la durata dei clic.
- Queste metriche di engagement riflettono il comportamento reale degli utenti e la loro soddisfazione con i risultati di ricerca, influenzando il ranking delle pagine.
- I dati di Chrome sono usati anche per determinare i Sitelink, ovvero i link aggiuntivi che appaiono sotto il risultato principale di una ricerca.
La sandbox per i siti nuovi o sconosciuti
I documenti confermano la presenza di una “sandbox”, un ambiente in cui i siti web vengono segregati in base alla loro giovane età o alla mancanza di segnali di fiducia. Questo significa che i nuovi siti web o quelli che non hanno ancora accumulato segnali di fiducia sufficienti possono essere temporaneamente limitati nei loro posizionamenti nei risultati di ricerca, fino a quando Google non valuta la loro qualità e affidabilità.
Conferme sui fattori di ranking
Oltre alle novità, il leak ha confermato alcune pratiche sospettate da tempo, come l’importanza dei seguenti fattori:
- Qualità dei contenuti ed esperienza utente: Creare contenuti di alta qualità e offrire una buona esperienza utente sono fattori cruciali per ottenere un buon posizionamento nei risultati di ricerca.
- Peso dei link e diversità delle fonti: La diversità e la rilevanza dei link rimangono fondamentali per il ranking. Google classifica i link in tre categorie (bassa, media, alta qualità) e utilizza i dati di clic per determinare a quale categoria appartiene un documento.
- Ruolo delle entità e autorevolezza degli autori: Google attribuisce grande importanza all’autorevolezza e alla credibilità degli autori, utilizzando queste informazioni per migliorare la pertinenza e la qualità dei risultati di ricerca.
- Peso del Brand (e vantaggi dei domini scaduti): Google tiene conto della storia di un dominio e del brand associato quando valuta la sua autorità e pertinenza, avvantaggiando i siti più vecchi e consolidati.
- Importanza dei link: Nonostante le numerose evoluzioni degli algoritmi di ricerca, i link continuano a giocare un ruolo cruciale nel determinare l’autorità e la pertinenza di una pagina.
- Metriche di engagement degli utenti: Google usa metriche di engagement degli utenti, come “goodClicks” e “badClicks”, per valutare la qualità dell’esperienza utente su una pagina e il grado di soddisfazione degli utenti con i risultati di ricerca.
Fattore di Ranking | Descrizione |
---|---|
Qualità dei contenuti | Creare contenuti di alta qualità è cruciale per ottenere un buon posizionamento. |
Esperienza utente | Offrire una buona esperienza utente, come velocità di caricamento e facilità di navigazione, è importante. |
Peso dei link | La diversità e la rilevanza dei link in entrata influenzano il ranking. |
Autorevolezza degli autori | L’autorevolezza e la credibilità degli autori sono fattori chiave. |
Peso del Brand | Google premia i siti più vecchi e consolidati con un brand riconosciuto. |
Metriche di engagement | “GoodClicks” e “badClicks” valutano la qualità dell’esperienza utente. |
Se hai bisogno di maggiori informazioni su azioni di web marketing contatta Pixo Comunicazione per ricevere ulteriori dettagli sui dati utilizzati dai sistemi di ricerca di Google.

Digital Agency per piccole e medie imprese
Potenzia la tua azienda con le nostre soluzioni
035.244295
Invia una richiesta
Via Provinciale, 2 - 24040 Lallio (BG)