Marketing digitale

Errori di scansione e indicizzazione in Google Search Console: guida completa alle soluzioni

  • 15 marzo 2025
  • 24 minuti di lettura
  • Team Hostragons
Errori di scansione e indicizzazione in Google Search Console: guida completa alle soluzioni

Gli errori di scansione e indicizzazione in Google Search Console compaiono quando Googlebot non riesce a raggiungere le pagine del sito, non può leggerle correttamente, viene bloccato da una configurazione tecnica oppure quando Google non considera quell’URL abbastanza utile da inserirlo nell’indice. Per risolverli nel modo giusto bisogna prima capire quanto è esteso il problema, eseguire un test live con lo strumento Controllo URL e poi verificare, in ordine, robots.txt, tag noindex, canonical, reindirizzamenti, codici di risposta del server, sitemap e qualità dei contenuti. L’approccio più efficace non è provare a correggere tutte le segnalazioni insieme, ma partire dalle pagine che incidono su traffico, lead e ricavi, seguendo un piano di intervento ordinato e misurabile.

Questa guida è stata preparata per il blog di Hostragons come checklist pratica per webmaster, SEO specialist e proprietari di siti. L’obiettivo è aiutarti a interpretare i report Copertura e Indicizzazione delle pagine in Search Console, individuare le cause reali degli errori e ottenere miglioramenti stabili dal punto di vista della SEO tecnica. In particolare, per e-commerce, siti aziendali, blog, portali di news e progetti con molte migliaia di URL, crawl budget, salute del server e corretta strategia di indicizzazione influenzano direttamente la visibilità organica.

Qual è la differenza tra scansione e indicizzazione?

La scansione, o crawling, è il processo con cui Googlebot scopre gli URL del tuo sito e prova ad accedere alle risorse necessarie per interpretarli: HTML, immagini, CSS, JavaScript e altri file. L’indicizzazione, invece, è la fase in cui Google analizza la pagina scansionata e decide se inserirla nel proprio indice, cioè se può essere mostrata nei risultati di ricerca. Una pagina può essere scansionabile ma non indicizzata. Allo stesso modo, un URL può essere presente nella sitemap ma non essere elaborato da Google a causa di robots.txt, noindex o errori del server.

Facciamo un esempio pratico: una pagina prodotto può essere inclusa in sitemap.xml, raggiungibile tramite link interni e restituire un codice di stato 200. Tuttavia, se nel codice HTML è presente un meta tag noindex, Google potrà anche scansionarla, ma non la aggiungerà all’indice. In un altro scenario, la pagina non contiene noindex, ma durante un picco di carico il server restituisce un errore 500; in questo caso Googlebot non riesce a scansionarla in modo affidabile e il processo di indicizzazione può rallentare o interrompersi.

Quali report controllare per primi in Google Search Console?

Secondo gli standard SEO più aggiornati, il primo passo per risolvere un problema è verificare l’affidabilità dei dati. In Search Console bisogna analizzare insieme soprattutto i report Pagine, Sitemap, Controllo URL e Statistiche di scansione. Prendere decisioni guardando un solo report può essere fuorviante. Per esempio, un URL indicato come Non indicizzato nel report Pagine potrebbe risultare indicizzabile nel test live dello strumento Controllo URL; spesso questa differenza dipende dal tempo trascorso tra l’ultima scansione di Google e la correzione che hai appena pubblicato.

1. Report Pagine

Il report Pagine mostra quali URL sono nell’indice, quali sono stati esclusi e quali tipi di errore o avviso sono stati rilevati. Lo scopo non è far indicizzare ogni singolo URL escluso. Pagine carrello, combinazioni di filtri, risultati di ricerca interna e URL duplicati con parametri possono essere tenuti fuori dall’indice in modo intenzionale. La tua priorità deve andare alle pagine da cui ti aspetti traffico organico: categorie, prodotti, servizi, articoli del blog, pagine brand e landing commerciali.

2. Strumento Controllo URL

Lo strumento Controllo URL è il mezzo più affidabile per fare diagnosi a livello di singola pagina. Qui puoi vedere l’ultima data di scansione di Google, se la scansione è consentita, il canonical dichiarato dall’utente, il canonical scelto da Google e lo stato di indicizzabilità della pagina. Quando lavori su un errore, esegui il test live per lo stesso URL e, se la correzione è andata a buon fine, invia una richiesta di indicizzazione. Tuttavia, per centinaia o migliaia di URL, è molto più sano risolvere la causa alla radice anziché inviare richieste manuali una per una.

3. Report Sitemap

La sitemap è una mappa stradale che comunica a Google quali URL sono importanti per il tuo sito. Nella sitemap dovrebbero essere presenti solo URL che restituiscono codice 200, puntano a se stessi come canonical, non contengono noindex e sono effettivamente destinati all’indicizzazione. Se in una sitemap da 10.000 URL ne hai 3.000 reindirizzati o con errore 404, stai facendo perdere tempo a Googlebot. Se usi WordPress, controlla con regolarità le impostazioni della sitemap generate dal plugin SEO; se usi un CMS proprietario, verifica la logica con cui gli URL vengono inseriti automaticamente. WordPress hosting çözümleri

4. Statistiche di scansione

Il report Statistiche di scansione indica con quale frequenza Googlebot visita il sito, quante richieste effettua, qual è il tempo medio di risposta e quali codici riceve. Se il tempo medio di risposta aumenta in modo costante, se gli errori 5xx diventano frequenti o se ci sono problemi di accesso al file robots.txt, le performance di indicizzazione possono risentirne. Nei periodi di campagne promozionali, nei siti di news e negli e-commerce con molti prodotti, un’infrastruttura hosting robusta diventa un fattore critico anche per la SEO. yüksek performanslı web hosting

Gli errori più comuni in Google Search Console e come risolverli

La tabella seguente riassume in modo rapido le cause più frequenti degli errori di scansione e indicizzazione in Google Search Console. Puoi usarla come prima checklist diagnostica e poi applicare i passaggi più dettagliati nelle sezioni successive.

Errore o avvisoPossibile causaPrioritàSoluzione di base
Errore server 5xxHosting, limiti di risorse, manutenzione, bug applicativoMolto altaAnalizza i log, aumenta le risorse, correggi plugin o moduli difettosi
Bloccato da robots.txtRegola disallow errataAltaSblocca le directory importanti ed esegui un test live
Tag noindexImpostazione di pagina o templateAltaRimuovi noindex dalle pagine da indicizzare
Rilevata, attualmente non indicizzataCrawl budget, bassa qualità, server lentoMedio-altaMigliora link interni, velocità, contenuto originale e sitemap
Scansionata, attualmente non indicizzataQualità del contenuto o forte somiglianza con altre pagineMediaArricchisci la pagina, controlla canonical e contenuti duplicati
Errore di reindirizzamentoCatena, loop o uso scorretto di 301/302AltaImposta un reindirizzamento 301 in un solo passaggio
Non trovata 404URL eliminato, link interno errato, vecchia sitemapDipende dal casoUsa 301 se serve, altrimenti rimuovi l’URL da sitemap e link interni

Come risolvere gli errori server 5xx?

Gli errori 5xx indicano che Googlebot, nel tentativo di accedere alla pagina, ha incontrato un problema lato server. Gli errori 500, 502, 503 e 504 sono tra i più comuni. Sono particolarmente importanti perché, se Google percepisce il server come instabile, può ridurre la frequenza di scansione. Durante una manutenzione breve l’uso del codice 503 può essere corretto; ma errori 5xx persistenti possono portare a cali di indicizzazione e perdita di visibilità.

Checklist operativa

  • Dal pannello di controllo hosting verifica CPU, RAM, I/O disco e limiti dei processi.
  • Nei log di errore del web server cerca problemi PHP, MySQL o applicativi ripetuti negli stessi minuti.
  • Se usi WordPress, testa temporaneamente gli ultimi plugin, temi o settaggi del firewall installati.
  • Controlla se sono presenti picchi di traffico bot, richieste malevole o segnali di attacco DDoS.
  • Implementa cache, CDN e ottimizzazione del database.

Per esempio, in un e-commerce con 20.000 prodotti, durante la scansione di Googlebot le query al database possono diventare pesanti e le pagine categoria possono restituire timeout 504. In un caso simile, chiedere semplicemente la convalida in Search Console non risolve il problema. Prima bisogna ottimizzare indici del database, paginazione, cache e risorse hosting. Per progetti in crescita, passare da un hosting condiviso a un VPS o a un’infrastruttura gestita più potente può migliorare direttamente la salute della scansione. VPS sunucu çözümleri

Come correggere i blocchi di scansione in robots.txt?

Il file robots.txt indica ai motori di ricerca quali aree del sito possono o non possono essere scansionate. Una sola regola scritta male può compromettere la visibilità di tutto il progetto. Succede spesso quando, durante lo sviluppo di un nuovo sito, si usano regole temporanee di blocco e poi ci si dimentica di rimuoverle al momento della messa online: Google non riesce così a scansionare pagine importanti.

I controlli principali da effettuare sono questi:

  • Il file robots.txt deve essere raggiungibile dal browser all’indirizzo tuodominio.com/robots.txt.
  • La regola Disallow: / non deve essere usata su un sito pubblicato, perché blocca l’intero sito.
  • I file CSS e JavaScript non devono essere bloccati senza motivo: Google deve poter renderizzare correttamente la pagina.
  • La posizione della sitemap dovrebbe essere indicata all’interno del robots.txt.
  • Aree come admin, carrello e account utente possono essere bloccate; categorie e contenuti editoriali no, se sono importanti per la SEO.

Robots.txt non è uno strumento per rimuovere pagine dall’indice. Se un URL era già stato indicizzato e poi viene bloccato con robots.txt, Google non può più scansionarlo e quindi non può leggere l’eventuale noindex. In questa situazione la pagina può restare nei risultati, magari senza descrizione. Per le pagine che vuoi escludere dall’indice, è più corretto consentire prima la scansione e usare noindex, per poi applicare, se necessario, una strategia di rimozione permanente.

Errore noindex: quando è un problema e quando è una strategia corretta?

Il tag noindex comunica a Google di non inserire una pagina nell’indice. Di per sé non è un errore: usato nel posto giusto è una scelta SEO corretta. Il problema nasce quando il noindex finisce per errore su pagine che dovrebbero ricevere traffico organico. In WordPress capita spesso che rimanga attiva l’opzione per scoraggiare i motori di ricerca dall’indicizzazione del sito, che un plugin SEO imposti noindex su un tipo di contenuto o che un software personalizzato generi un meta tag sbagliato a livello di template.

Per controllare noindex, usa lo strumento Controllo URL e verifica la sezione che indica se l’indicizzazione della pagina è consentita. Poi controlla nel codice sorgente il meta tag robots e, se necessario, l’header HTTP X-Robots-Tag. Quest’ultimo può essere usato per PDF, immagini o URL di file. Se la pagina è importante per il tuo business, il noindex va rimosso, la pagina deve restituire codice 200, deve essere inclusa in sitemap e deve ricevere link interni coerenti.

Errore “Rilevata, attualmente non indicizzata”

Questo stato indica che Google conosce l’URL, ma non ha ancora scelto di scansionarlo. È comune nei siti grandi, soprattutto per nuovi prodotti o nuovi articoli del blog. Google distribuisce il crawl budget in base all’autorevolezza del sito, alla velocità di risposta del server, alla qualità degli URL e ai segnali dei link interni. Se generi migliaia di URL a basso valore, la scansione delle pagine importanti può essere ritardata.

Passaggi per la soluzione

  • Sostieni gli URL importanti con link interni dalla home page, dalle categorie e da contenuti correlati.
  • Mantieni nella sitemap solo URL puliti e realmente destinati all’indicizzazione.
  • Migliora la velocità di caricamento, prestando attenzione soprattutto a un TTFB basso e stabile.
  • Evita la proliferazione inutile di URL con filtri, ordinamenti e parametri.
  • Offri nella pagina descrizioni originali, prezzi, disponibilità, immagini, dettagli tecnici e informazioni utili per l’utente.

Esempio concreto: se un’azienda di hosting crea pagine quasi identiche per 200 combinazioni di località e pacchetti, il numero di URL rilevati ma non scansionati può aumentare rapidamente. Meglio selezionare le pagine che rispondono davvero a un’intenzione di ricerca e arricchirle con confronti originali, scenari d’uso, spiegazioni sui prezzi e dettagli tecnici specifici.

Errore “Scansionata, attualmente non indicizzata”

Questo avviso indica che Google ha scansionato la pagina, ma ha deciso di non inserirla nell’indice. Nella maggior parte dei casi il problema è collegato a qualità del contenuto, struttura ripetitiva, scarso valore informativo o segnali canonical ambigui. Google tende sempre di più a indicizzare non solo le pagine tecnicamente accessibili, ma quelle che offrono un contributo reale e utile alla persona che effettua la ricerca.

Per risolvere questo errore, aumenta il valore unico della pagina. Trasforma una pagina servizio generica da 150 parole in una risorsa completa che risponde alle domande degli utenti, spiega le caratteristiche tecniche, chiarisce la logica dei prezzi, utilizza immagini e collega pagine correlate. Quando aggiorni un contenuto, non limitarti ad aumentare il numero di parole: aggiungi esempi reali, tabelle, confronti e informazioni che aiutino davvero a prendere una decisione. SEO uyumlu web sitesi hazırlama rehberi

Errori canonical e problemi di URL duplicati

Errori canonical e problemi di URL duplicati

Il tag canonical indica quale URL deve essere considerato la versione principale tra pagine simili o duplicate. Negli e-commerce è frequente che lo stesso contenuto sia accessibile da molti URL a causa di colore, taglia, ordinamento, filtri e parametri promozionali. Se Google sceglie un canonical diverso da quello dichiarato da te, in Search Console potresti vedere una differenza tra il canonical indicato dall’utente e quello selezionato da Google.

Per gestire correttamente i canonical, segui questi principi:

  • Ogni pagina che vuoi indicizzare dovrebbe indicare se stessa come canonical.
  • Gli URL con parametri e le versioni ripetute dovrebbero puntare come canonical alla pagina principale più pertinente.
  • L’URL di destinazione del canonical deve restituire codice 200, non avere noindex e non essere bloccato da robots.txt.
  • Non usare canonical e reindirizzamento 301 in modo contraddittorio.
  • Nella sitemap inserisci solo gli URL canonici principali.

Un canonical errato può trasferire la visibilità di una pagina ben costruita a un altro URL meno rilevante. Per questo è importante testare la generazione automatica dei canonical a livello di template, soprattutto su categorie, prodotti e pagine servizio.

Errori di reindirizzamento: catene, loop e codici sbagliati

Gli errori di reindirizzamento nascono quando URL spostati o eliminati non vengono indirizzati correttamente verso la nuova destinazione. I problemi più frequenti sono le catene di redirect, i loop di reindirizzamento, l’uso di un codice temporaneo 302 al posto di un trasferimento permanente 301 e la confusione tra versioni http/https o www/non-www.

Il reindirizzamento ideale porta dal vecchio URL al nuovo URL con un 301 in un solo passaggio. Per esempio, se un vecchio articolo del blog viene spostato in una nuova struttura di categorie, il vecchio indirizzo non dovrebbe passare prima dalla versione http, poi https, poi www e infine dal nuovo slug. Questa catena rallenta l’esperienza utente e riduce l’efficienza di scansione di Googlebot. Durante il passaggio a SSL, assicurati che tutti i link interni, i tag canonical e gli URL della sitemap siano aggiornati in https. SSL sertifikası seçenekleri

Come gestire errori 404 e Soft 404?

Un errore 404 indica che un URL non è stato trovato. Non tutti i 404 sono negativi. È normale che pagine davvero rimosse, senza alternative e senza valore di traffico o backlink restituiscano 404 o 410. Il problema si presenta quando pagine importanti diventano 404 per errore, quando nella sitemap sono presenti URL 404 o quando i link interni mandano gli utenti verso pagine vuote.

Un Soft 404, invece, si verifica quando una pagina restituisce tecnicamente codice 200 ma, dal punto di vista del contenuto, si comporta come una pagina non trovata. Per esempio, una pagina prodotto esaurita o rimossa che mostra un template vuoto con codice 200 può essere interpretata da Google come Soft 404. Se esiste un prodotto alternativo, puoi reindirizzare con 301 alla categoria pertinente o a un prodotto equivalente. Se non esiste un’alternativa valida, restituire 410 fornisce un segnale più chiaro.

Strategia sitemap: chiarisci quali pagine devono essere indicizzate

La sitemap deve presentare a Google gli URL a cui dai priorità. Un errore molto comune è inserire nella sitemap tutti gli URL generati dal sistema. In realtà, la sitemap non è un contenitore indiscriminato, ma un filtro di qualità. URL che non vuoi indicizzare, indirizzi reindirizzati, pagine noindex, filtri con parametri e pagine 404 non dovrebbero comparire nella sitemap.

In una buona struttura sitemap, contenuti come articoli del blog, pagine statiche, categorie e prodotti possono essere separati in mappe distinte. Anche se non raggiungi il limite di 50.000 URL, nei siti grandi una gestione modulare delle sitemap rende l’analisi molto più semplice. La data di ultima modifica deve riflettere aggiornamenti reali: far risultare ogni giorno tutti gli URL come appena modificati non crea un segnale affidabile. Se usi un nuovo dominio, anche la corretta e stabile configurazione DNS è importante per l’accesso di Googlebot. domain tescil ve DNS yönetimi

Priorità SEO tecniche per migliorare il crawl budget

Il crawl budget può essere inteso come la quantità e la profondità degli URL che Googlebot sceglie di scansionare sul tuo sito in un determinato periodo. Per siti piccoli di solito non è un problema critico; ma nei progetti con migliaia di URL, generazione incontrollata di pagine e server lenti possono causare perdite importanti.

Consigli pratici per il crawl budget

  • Riduci gli URL con parametri inutili e rimuovili dai link interni.
  • Apri all’indicizzazione le pagine filtro solo se hanno reale domanda di ricerca; gestisci le altre con noindex o canonical.
  • Rafforza l’architettura dei link interni: le pagine importanti non dovrebbero trovarsi a più di tre clic di profondità.
  • Misura regolarmente il tempo di risposta del server e confronta i picchi improvvisi con i log.
  • Controlla mensilmente i link interni rotti con strumenti di crawling.
  • Ottimizza immagini, CSS e JavaScript per ridurre il costo di rendering.

Per esperienza, nei siti di grandi dimensioni anche solo la pulizia di 404 e catene di redirect può aiutare Googlebot a scansionare un numero maggiore di pagine importanti. Inoltre, descrizioni di qualità nelle categorie e link interni verso prodotti correlati possono aumentare il tasso di indicizzazione.

Piano passo dopo passo per risolvere gli errori

Quando gestisci gli errori di Search Console, evita interventi disordinati e segui un piano chiaro. Questo metodo funziona sia per blog singoli sia per progetti aziendali complessi.

  1. Dal report Pagine identifica il tipo di errore più rilevante e il numero di URL coinvolti.
  2. Dai priorità alle pagine che generano ricavi, lead o traffico organico.
  3. Scegli 5-10 URL di esempio per ogni tipo di errore ed esegui un test live nello strumento Controllo URL.
  4. Controlla codice di risposta del server, robots.txt, noindex, canonical, sitemap e link interni.
  5. Individua la causa principale; invece di correggere URL singoli, applica soluzioni a livello di template o sistema.
  6. Dopo la correzione, monitora log e report di Search Console per 7-28 giorni.
  7. Se l’intervento è riuscito, richiedi la convalida ed estendi lo stesso controllo agli altri gruppi di URL.

Il punto chiave è ricordare che i dati di Search Console non sono in tempo reale, ma arrivano con ritardo. Un errore corretto oggi può restare visibile nel report ancora per alcuni giorni o settimane. Per questo conviene valutare insieme test live, log del server e controllo reale dei codici di stato.

Quando sospettare un problema legato all’hosting?

Non tutti i problemi di indicizzazione dipendono dall’hosting, ma alcuni segnali puntano chiaramente verso l’infrastruttura. Se nel report Statistiche di scansione il tempo medio di risposta aumenta, se gli errori 5xx crescono in determinate fasce orarie, se le visite dei bot saturano il limite CPU o se il sito rallenta sotto traffico intenso, è il momento di rivedere il piano hosting. DNS affidabile, versione PHP aggiornata, CPU/RAM adeguate, storage veloce, backup e livelli di sicurezza sono componenti fondamentali della SEO tecnica.

Per esempio, durante una campagna promozionale il traffico organico può triplicare e, nello stesso momento, Googlebot può avviare una scansione intensa. Un’infrastruttura debole può generare errori 503. Questo non significa solo perdere utenti, ma anche ridurre l’affidabilità percepita da Google per l’indicizzazione. Hosting scalabile, cache configurata correttamente e continuità SSL supportano la performance SEO in modo diretto, non solo indiretto. kurumsal hosting paketleri

Checklist finale: prima della pubblicazione

  • Le pagine importanti restituiscono codice di stato 200?
  • Robots.txt blocca cartelle o risorse importanti?
  • Noindex è presente solo sulle pagine che vuoi davvero tenere fuori dall’indice?
  • I tag canonical puntano all’URL principale corretto?
  • La sitemap contiene solo URL puliti e indicizzabili?
  • Esiste un 301 in un solo passaggio da HTTP a HTTPS e dai vecchi URL ai nuovi?
  • Le pagine 404 sono state rimosse dai link interni e dalla sitemap?
  • Nei log del server compaiono errori 5xx o timeout ricorrenti per Googlebot?

Questa checklist è la base di una manutenzione SEO tecnica regolare. Eseguire una scansione completa una volta al mese, esportare i report di Search Console e annotare le modifiche fatte permette di diagnosticare più rapidamente eventuali perdite di indicizzazione future.

Domande frequenti

Quanto tempo serve per vedere i risultati dopo aver corretto gli errori in Google Search Console?

Dipende dal tipo di errore e dalla frequenza con cui il tuo sito viene scansionato. I risultati possono comparire dopo pochi giorni o dopo alcune settimane. Il test live dell’URL mostra lo stato attuale, ma l’aggiornamento dei report di Search Console può arrivare in ritardo.

L’errore “Rilevata, attualmente non indicizzata” è sempre negativo?

No. Google può decidere di scansionare più avanti URL nuovi o a bassa priorità. Tuttavia, se l’avviso riguarda pagine importanti e si ripete nel tempo, bisogna migliorare link interni, sitemap, velocità della pagina, risposta del server e qualità del contenuto.

Ho rimosso il tag noindex: perché la pagina non è ancora indicizzata?

Google deve scansionare di nuovo la pagina. Inoltre, assicurati che non sia bloccata da robots.txt, che il canonical sia corretto, che restituisca codice 200 e che offra un contenuto di qualità sufficiente per meritare l’indicizzazione.

Devo reindirizzare sempre gli errori 404 con un 301?

No. URL vecchi, senza alternative, senza traffico e senza valore di backlink possono restare 404 o 410. Gli URL importanti che hanno una pagina equivalente o aggiornata dovrebbero invece essere reindirizzati con 301 alla destinazione più pertinente.

La scelta dell’hosting influisce sull’indicizzazione?

Sì. Tempi di risposta lenti, limiti di risorse, errori 5xx frequenti e configurazioni SSL o DNS instabili possono ridurre l’efficienza di scansione di Googlebot. Un hosting stabile e veloce è una base solida per la SEO tecnica.

In sintesi, gli errori di scansione e indicizzazione in Google Search Console, se interpretati correttamente, offrono segnali preziosi per migliorare la salute tecnica del sito. Prima individua gli URL importanti, verifica l’errore con test live e log, poi controlla in modo sistematico robots.txt, noindex, canonical, reindirizzamenti, sitemap, qualità dei contenuti e performance del server. Se vuoi sostenere questo lavoro con un’infrastruttura più veloce, sicura e stabile, puoi valutare le soluzioni hosting, dominio e SSL di Hostragons e costruire fondamenta più affidabili per il tuo sito.

Condividi questo articolo:

Team Hostragons

Guide aggiornate dal nostro team di esperti su hosting, server e nomi di dominio. Troviamo insieme la soluzione ideale per il tuo progetto.

Contattaci