Question 1

Cos'è un file robots.txt?

Accepted Answer

Un file robots.txt è un file di testo semplice posizionato nella radice del tuo sito web (es. example.com/robots.txt) che indica ai crawler dei motori di ricerca quali pagine o sezioni del sito possono o non possono essere scansionate. Segue il Robots Exclusion Protocol, uno standard utilizzato da tutti i principali motori di ricerca, inclusi Google, Bing e Yahoo. Il file contiene direttive come User-agent, Disallow, Allow e Sitemap per controllare il comportamento dei crawler.

Question 2

Il robots.txt impedisce l'indicizzazione delle pagine?

Accepted Answer

No. Una direttiva Disallow in robots.txt indica ai crawler di non scansionare una pagina, ma non impedisce che la pagina compaia nei risultati di ricerca. Se altre pagine collegano un URL disallowed, Google può comunque indicizzarlo basandosi su informazioni esterne come il testo di ancoraggio. Per impedire davvero l'indicizzazione, usa un meta tag noindex o un'intestazione HTTP X-Robots-Tag. Robots.txt controlla la scansione, non l'indicizzazione.

Question 3

Dove devo posizionare il mio file robots.txt?

Accepted Answer

Il tuo file robots.txt deve essere posizionato nella directory radice del tuo sito web in modo che sia accessibile all'indirizzo yourdomain.com/robots.txt. Deve essere servito dal dominio e protocollo (HTTP o HTTPS) esatti a cui vuoi che si applichi. Per esempio, https://example.com/robots.txt si applica solo a https://example.com, non a https://www.example.com o http://example.com. Ogni sottodominio necessita del proprio file robots.txt.

Question 4

Quali sono le direttive robots.txt più comuni?

Accepted Answer

Le direttive più comuni sono: User-agent (specifica a quale crawler si applicano le regole, usa * per tutti i crawler), Disallow (blocca un percorso dalla scansione), Allow (consente la scansione di un percorso specifico all'interno di una directory disallowed), Sitemap (indica ai crawler l'URL della tua sitemap XML) e Crawl-delay (richiede ai crawler di attendere un certo numero di secondi tra le richieste, supportato da Bing e Yandex ma non da Google). Queste direttive sono sensibili al maiuscolo/minuscolo e devono rispettare una sintassi esatta per funzionare correttamente.

Generatore di Robots.txt

Crea il tuo Robots.txt

Il tuo file Robots.txt

Vuoi monitorare le tue classifiche?

Cos'è un file Robots.txt?

More Free SEO Tools

Domande frequenti

Cos'è un file robots.txt?

Il robots.txt impedisce l'indicizzazione delle pagine?

Dove devo posizionare il mio file robots.txt?

Quali sono le direttive robots.txt più comuni?

Generatore di Robots.txt

Crea il tuo Robots.txt

Il tuo file Robots.txt

Vuoi monitorare le tue classifiche?

Cos'è un file Robots.txt?

More Free SEO Tools

Domande frequenti

Cos'è un file robots.txt?

Il robots.txt impedisce l'indicizzazione delle pagine?

Dove devo posizionare il mio file robots.txt?

Quali sono le direttive robots.txt più comuni?

Strumenti correlati

Tester di Robots.txt

Generatore di Sitemap

Tester di accesso bot AI

Generatore di Meta Tag