Creare una sitemap per i motori di ricerca

sitemap per i motori di ricerca

Creare una sitemap per i motori di ricerca

Come creare una sitemap per i motori di ricerca ? Quali tipi di sitemap esistono? Come creiamo sitemap.xml ?

La sitemap è lo strumento che i webmasters possono sfruttare per migliorare la navigazione da parti degli utenti in un sito web e per consentire ai motori di ricerca di velocizzare l’indicizzazione di tutte o alcune pagine del sito stesso (sitemap.xml per Google e urlist.txt per Yahoo).

Sitemap.xml viene utilizzato da Google e Bing per leggere ed indicizzare tutte le pagine. Ricordo che, se non volete indicizzare tutti i file/directory del vostro sito potete far ricorso al file robots.txt. Il file sitemap.xml dovrà essere caricato nella directory principale del dominio (es. www.nomesito.it/sitemap.xml), se vogliamo fare in modo che Google e gli altri motori di ricerca lo leggano.

Sitemap per i motori di ricerca

La creazione di tale file può essere fatta manualmente per piccoli siti, anche se il mio consiglio è comunque quello di generare il file sitemap.xml attraverso appositi tools online gratuiti, come XML-Sitemaps.com, o utilizzando dei programmi scaricabili dal web (personalmente uso A1 Sitemap Generator, che è un software a pagamento con diverse funzionalità interessanti).

È importante ricordare che ogni sitemap non può contenere più di 50.000 URL e non deve superare i 10 MB. Nel caso in cui il sito abbia più di 50.000 URL occorrerà creare una Sitemap Index, che ha il compito di contenere le URL di tutte le sitemap pubblicate nel sito ed indicarne il percorso, come un sommario.

I file della Sitemap Index possono contenere fino a 1.000 Sitemap e non devono avere una dimensione superiore a 10 MB. Si può utilizzare gzip per comprimere le Sitemap. A questo punto vi basterà creare una sitemap index (prime 2 righe) ed inserirci all’interno le URL di tutte le sitemap di sezione. A seguire un esempio:

<?xml version=”1.0″ encoding=”UTF-8″?>
<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>

Struttura del file sitemap.xml

Abbiamo visto che attraverso il file sitemap.xml, comunichiamo ai motori di ricerca quali sono i file/directory contenuti nel sito (pagine html, file pdf, immagini,..). In particolare, oltre ovviamente alla lista delle url presenti, questo file xml indica allo spider lafrequenza di aggiornamento delle nostre pagine (“changefreq”), la data dell’ultima modifica (“lastmod”) ed il valore di importanza relativamente alle altre pagine del sito (“priority”).

Questo 3 parametri non sono obbligatori, ma servono però a far capire ai motori di ricerca che il nostro sito è periodicamente aggiornato, cosa che favorisce la scalata alle SERP delle nostre pagine. Analizziamo la struttura completa della sitemap attraverso un esempio:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">

<url>
<loc>http://www.la-certificazione-energetica.net/</loc>
<lastmod>2011-11-24T12:02:03+00:00</lastmod>
<changefreq>hourly</changefreq>
<priority>0.9</priority>
</url>

<url>
<loc>http://www.la-certificazione-energetica.net/certificazione_energetica.html</loc>
<lastmod>2011-08-29T14:13:14+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.1</priority>
</url>

</urlset>

Esaminiamo i diversi tag XML:

  • la sitemap è inserita all’interno del tag <urlset> e </urlset>. Questo attributo, obbligatorio, costituisce il file e fa riferimento agli standard del protocollo corrente.
  • <url>, obbligatorio, è il tag principale per ogni voce URL. I tag restanti sono secondari di questo tag.
  • <loc>, obbligatorio, specifica l’URL della pagina, che deve iniziare con il protocollo (ad esempio http) e terminare con una barra finale, se richiesto dal server web. Questo valore deve contenere meno di 2048 caratteri
  • <lastmod> specifica la data dell’ultima modifica del file. Questa data dovrebbe avere il formato W3C Datetime, che consente di omettere l’ora, se lo si desidera, e di utilizzare il formato AAAA-MM-GG.
  • <changefreq> specifica la frequenza con la quale la pagina potrebbe venire modificata. I valori validi sono:- always
    – hourly
    – daily
    – weekly
    – monthly
    – yearly
    – neverIl valore “always” deve essere utilizzato per descrivere i documenti che subiscono modifiche ogni volta che vi si accede. Il valore “never” deve essere utilizzato per descrivere gli URL archiviati.
  • <priority> specifica la priorità di questo URL rispetto ad altri URL del sito. L’intervallo di valori validi è compreso tra 0,0 e 1,0. Questo valore non influisce sul modo in cui le pagine vengono confrontate con le pagine di altri siti, ma consente di indicare ai motori di ricerca le pagine che si reputano più importanti per i crawler. La priorità predefinita di una pagina è 0,5.

Tipi di sitemap XML

Esistono diversi tipi di sitemap XML (eXtensible Markup Language) che possono essere generate e caricate nel server dove è residente il sito web. Ciascuna di queste sitemap può contenere specifici tipi di links:

  • sitemap (sitemap.xml): pagina che contiene la lista gerarchica di tutte le pagine del sito web e facilita l’indicizzazione delle stesse da parte dei motori di ricerca. Introdotta da Google, viene utilizzata anche da altri motori di ricerca, quali Bing, Yahoo e MSN;
  • sitemap per dispositivi mobili (sitemap-mobile.xml): pagina che contiene la lista gerarchica di tutte le pagine del sito web utilizzata per l’indicizzazione delle stesse sui dispositivi mobile;
  • sitemap per immagini (sitemap-image.xml): Google sitemap che contiene tutti i link alle immagini presenti nel sito e le informazioni ad esso correlate. Molto utile nel caso di ricerca per immagini, viene utilizzata anche da Bing. Vi ricordo di dare all’immagine un nome comprensibile ed attinente al contenuto della pagina. Una immagine con un nome tipo xyz-01pq.jpg non permette a Google di capirne bene il contenuto. Usate inoltre in maniera corretta l’attributo ALT. Google utilizza questo attributo per determinare le migliori immagini da presentare nella SERP per specifici termini di ricerca.
  • sitemap per video (sitemap-video.xml): sitemap video permette la segnalazione di contenuti multimediali da includere nell’indice di Google Video. Permette di indicare alcuni metadati aggiuntivi per il video come un titolo, una descrizione ed una thumbnail personalizzata. Google può decifrare i seguenti formati video: mv, mp4, mpeg, mpg, m4v, asf, flv, swf, avi, ra e ram.

Esistono altri formati di sitemap utilizzabili per: mobile (sitemap-mobile.xml), news (sitemap-news.xml), coordinate geografiche (geositemap.xml). La Mobile Sitemap deve essere creata nel caso in cui si vogliano distribuire contenuti appositamente creati per la consultazione con dispositivi mobile (smartphone).

La News Sitemap è un formato rivolto esclusivamente ai siti che pubblicano notizie o articoli e che sono inclusi in Google News. Non rispettare questa ultima condizione rende del tutto inutile la creazione di tale mappa. La Geo Sitemap consente di segnalare a Google la presenza sul nostro sito di risorse con collocazione geografica. Questi elementi possono così essere indicizzati e resi disponibili su Google Earch e Google Maps.

Se volete approfondire l’argomento visitate il sito ufficiale sitemaps.org.Salva

Salva

Print Friendly, PDF & Email

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *