A localização de um arquivo sitemaps é algo bastante importante já que vai nos dizer o tipo de urls que podemos incluir. O mais simples de entender é que se nós colocarmos o arquivo sitemap em uma url como esta: http://www.dominio.com/pasta/ não poderíamos incluir urls como a seguinte: http://www.dominio.com/prova.html
Outro fator importante a ter em conta é que todas as urls do arquivo sitemaps têm que ter o mesmo protocolo, ou seja, se incluímos url do tipo de http://.... não podemos colocar urls do tipo de https://.....
Se não cumprirmos alguma destas normas, as urls não serão tomadas em conta, pelo qual estaremos realizando um trabalho para nada.
Também podemos utilizar url com p-ortos, do tipo: http://www.dominio.com:100/sitemaps.xml. Ao situar aí o arquivo, temos que ter em conta que todas as urls dos arquivos terão começar por http://www.dominio.com:100/
O primeiro que temos que fazer é demonstrar que somos os proprietários dos domínios indicados no arquivo. Para isso, temos em Google uma ferramenta que nos facilita o trabalho.
Porém, aqui não acaba a coisa, se nós criarmos um sitemap como este:
http://www.dominio.com/sitemap-host1.xml
http://www.dominio.com/sitemap-host2.xml
http://www.dominio.com/sitemap-host3.xml
Este arquivo nos dará um erro de ?envio cruzado? já que está tentando enviar endereços URL de www.host1.com através de um Sitemap que está no domínio www.dominio.com, que não tem nada a ver com o domínio dos host especificados. Bom, isto podemos solucionar de duas formas. A primeira é a ferramenta já citada de administração de Google. E a segunda, é a modificação de nosso arquivo robots.txt em cada host especificado. Temos somente que adicionar a url do domínio onde se encontre o arquivo sitemaps, neste caso em www.dominio.com
A linha a incluir em robots.txt seria algo como isto:
Sitemap: http://www.dominio.com/sitemap-host1.xml
E assim com o resto de hosts...
Isto o que faz é verificar que se podemos modificar robots.txt e apontar para www.dominio.com é que somos proprietários de ambos domínios.
Ademais, também recomendo que o arquivo de sitemaps sempre se chame sitemap.xml ou sitemap.txt, já que é mais fácil de reconhecer que se dermos outro nome, embora isto não seja uma regra obrigatória.
Com isto terminamos a parte de criação de um arquivo sitemap manual, e começamos a ver como subi-lo a Google ou como realiza-los com programas externos.