Outros formatos de sitemaps

Além de XML podemos criar sitemaps em feed RSS e arquivos de texto.

Por Sara Alvarez Langa


Publicado em: 18/3/10
Valorize este artigo:
É certo que o formato mais utilizado para a criação de sitemaps é XML, porém existem outras duas formas distintas de criá-los. São formas que se utilizam também em arquivos de texto, porém com outras sintaxes, que podem ser úteis em certos casos ou com os que talvez nos sintamos mais à vontade trabalhando. No Manual de Sitemaps de CriarWeb.com veremos a seguir quais são estas outras maneiras de produzir os sitemaps, uma é a criação de um sitemaps mediante um feed RSS e a outra é mediante um simples arquivo de texto de sintaxe plana.

Sitemaps em formato de feed RSS

Este formato é fácil de utilizar se já tivermos feed em nossa página web, porém tem um problema e é para os buscadores nem sempre vai mostrar todas as urls de sua página, já que mostrará sempre as que se atualizaram recentemente.

A mecânica de construção do arquivo seria a mesma que a de qualquer arquivo feed, cuja sintaxe e características podemos ver no Manual de RSS. No entanto, sempre devemos ter em conta que os motores de busca observariam principalmente o campo link e o campo data.

Ademais é importante colocar o arquivo na raiz do domínio, para que os buscadores possam rastrear todas as pastas e URLs que incluímos no sitemap.

Google tem um sistema dentro da zona de ferramentas de webmaster que te permite subir seus feeds para que Google os tenha em conta como sitemaps.

Um exemplo de feed preparado para atuar como sitemap seria o seguinte:

<?xml version="1.0" encoding="ISO-8859-1"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>Sitemap</title>
<link>http://www.dominio.com</link>
<description>Todas as urls de meu dominio</description>
<language>es-es</language>
<item>
   <title>Titulo pagina</title>
<description>Descricao da url</description>
<link>A url completa </link>
<pubDate>Wed, 21 Oct 2009 11:57:44 +0200</pubDate>
</item>
</channel></rss>

Sitemaps em arquivo de texto com formato plano

Este formato é muito parecido ao que utilizamos para criar os robots.txt. Consiste basicamente em um arquivo de texto plano no qual colocamos as urls, cada uma em uma fila, com a rota completa (incluindo o http://).

O arquivo de texto só pode conter URLs, estar codificado em UTF-8, conter como máximo 50,000 endereços e não superar os 10 MB. Ademais não pode conter nem cabeçalho nem rodapé de página.

Pode dar o nome que quiser ao arquivo sempre e quando cumpra com os padrões RFC-3986 para endereços URI e ao padrão RFC-3987 para endereços IRI.

E quanto à localização, como no resto de formatos disponíveis para sitemaps, o aconselhável é colocá-lo na raiz de nosso domínio.

Um exemplo de arquivo de texto com as URL do site, em formato válido para utilizar como sitemap, seria simplesmente isto:

http://www.dominio.com/pagina.html
hhtp://www.dominio.com/pagina2.html
http://www.dominio.com/pasta/pagina.html

Conclusão sobre formatos de sitemap

Definitivamente, eu considero que dos três formatos o mais adequado é o arquivo XML, já que no caso do feed nem sempre vão se rastrear todas as páginas (por ser um arquivo que armazena as novidades do site). No caso do arquivo de texto, considero que é incômodo de construir, já que temos que ir linha por linha escrevendo todas as URLs. Se se trata de uma web com pouco conteúdo não é uma tarefa muito complicada, porém se se trata de uma web com muito conteúdo possivelmente nos levaria muito tempo, inclusive teríamos que construir mais de um arquivo. Não obstante, também temos que ter em conta a possibilidade de criar o arquivo do sitemap de maneira automatizada, com algum script, porém isto o deixamos para mais adiante.

No seguinte artigo, falaremos da localização em nosso domínio de tais arquivos sitemaps.





Comentários do artigo
Foi enviado 1 comentário ao artigo
1 comentário revisado:
HTML Sitemap
Por: danielsonna
21/3/10
Também temos que destacar o sitemap em HTML, que fica no site visível ao usuário. Perfeito para guiar o usuário em sites com grande volume de conteúdo.

<a href="http://www.sonna.com.br">Sonna - Criação de sites</a>

Usuários :    login / registro

Manuais relacionados
Categorias relacionadas
O autor

Home | Sobre nós | Copyright | Anuncie | Entrar em contato