Sitemap XML: o que é, para que serve e como validar
Um sitemap é um arquivo que lista as URLs do seu site que você quer que sejam rastreadas e indexadas pelos buscadores. Ele não força a indexação nem melhora o ranqueamento, mas serve para ajudar o Google a descobrir páginas que poderiam passar despercebidas, sobretudo em sites grandes, novos ou mal interligados.
O que é um sitemap?
Um sitemap é um arquivo no qual você informa aos buscadores quais páginas, vídeos e outros arquivos existem no seu site e como eles se relacionam. Segundo a documentação do Google, mecanismos de buscas leem esse arquivo para rastrear o site de forma mais eficiente, identificando rapidamente as URLs que você considera importantes.
O formato mais comum é o sitemap XML, um arquivo de texto estruturado que lista cada URL dentro de uma tag <loc> e pode incluir metadados opcionais, como a data da última modificação (<lastmod>). A versão mínima de um sitemap válido segue o protocolo de sitemaps.org e usa codificação UTF-8.
Para que serve e quando você deve usar um sitemap
Um sitemap serve para descoberta de URLs, não para ranqueamento. O Google deixa claro que, se as páginas estão bem interligadas, o Googlebot costuma descobrir a maior parte do site apenas seguindo links. O sitemap entra como reforço quando essa descoberta natural falha.
Pela orientação oficial do Google, um sitemap ajuda principalmente quando:
- o site é muito grande e dificilmente todas as páginas estão linkadas entre si;
- o site tem um arquivo extenso de páginas isoladas ou mal interligadas;
- o site é novo e recebe poucos links externos;
- o site tem muito conteúdo de mídia (imagens, vídeos) ou aparece no Google Notícias.
Por outro lado, o Google afirma que talvez você não precise de um sitemap se o site for pequeno (cerca de 500 páginas ou menos), for completamente interligado por navegação interna e não tiver mídia ou notícias que você queira ver na busca.
Ter um sitemap não traz nenhuma penalização, então na dúvida, mantenha um. Mas lembre que estar no sitemap só resolve a etapa de descoberta. Cada URL ainda precisa de bons sinais na própria página, como um title tag bem escrito e uma meta description adequada, para valer a pena ser indexada e exibida. Para uma visão geral de todas as tags relevantes, veja o guia de meta tags HTML.
Tipos e formatos de sitemap
O Google aceita os formatos definidos pelo protocolo de sitemaps e não tem preferência entre eles. A escolha depende da sua estrutura e do que o seu CMS já gera automaticamente.
| Formato | Quando usar | Limitação |
|---|---|---|
| XML | Caso mais comum e versátil; suporta extensões de imagem, vídeo e notícias | Pode ser trabalhoso de manter à mão em sites grandes |
| RSS 2.0, mRSS e Atom 1.0 | Quando o CMS já gera um feed automaticamente | Em geral lista só as URLs recentes |
| Texto | Lista simples de URLs, uma por linha, em arquivo .txt | Só aceita URLs de páginas indexáveis, sem metadados |
O XML é o mais flexível porque permite acrescentar informações extras sobre o conteúdo. Já o feed RSS ou Atom é prático por vir pronto na maioria dos CMSs, mas costuma cobrir apenas as publicações mais novas, segundo a documentação de construção de sitemaps do Google.
Limites do protocolo: 50 mil URLs e 50 MB
Um único arquivo de sitemap pode conter no máximo 50.000 URLs e não pode exceder 50 MB descompactado (52.428.800 bytes). Esse limite vale para todos os formatos e está definido tanto no protocolo de sitemaps.org quanto na documentação do Google.
Se o seu site ultrapassa esses limites, divida a lista em vários sitemaps e crie um arquivo de índice de sitemaps (sitemap index), que aponta para os arquivos individuais. Pela especificação do protocolo, um índice pode referenciar até 50.000 sitemaps e também não pode passar de 50 MB. Você pode compactar os arquivos com gzip para economizar banda, mas o tamanho descompactado de cada um precisa continuar dentro do limite de 50 MB.
Como criar e gerar um sitemap
A forma de criar um sitemap depende do tamanho e da arquitetura do site. O Google descreve três caminhos na sua documentação.
A primeira opção é deixar o CMS gerar o sitemap por você. Plataformas como WordPress, Wix e Blogger costumam criar e manter um sitemap automaticamente, sem configuração. A segunda opção é criar o arquivo manualmente, viável apenas para sites com poucas dezenas de URLs, abrindo um editor de texto e seguindo a sintaxe do formato escolhido. A terceira é gerar o sitemap de forma automatizada por um software ou ferramenta, recomendada quando há mais do que algumas dezenas de URLs.
Em qualquer caminho, inclua no sitemap só as URLs que você quer ver na busca: páginas canônicas, indexáveis, que retornam 200 e não estão bloqueadas por noindex ou robots.txt. Use sempre URLs absolutas e completas (por exemplo, https://www.exemplo.com.br/pagina.html, nunca /pagina.html), com codificação UTF-8. O recomendado é hospedar o arquivo na raiz do site, já que um sitemap afeta apenas as URLs no diretório onde está, a menos que você o envie pelo Search Console.
wp-sitemap.xml: o sitemap nativo do WordPress
Desde a versão 5.5, lançada em agosto de 2020, o WordPress gera um sitemap XML nativo automaticamente, disponível em /wp-sitemap.xml. O recurso foi incorporado ao núcleo do WordPress, conforme o anúncio oficial da equipe de desenvolvimento, e dispensa qualquer plugin para sites simples.
Esse sitemap nativo é um índice que pode conter até 50.000 sitemaps, com cada arquivo limitado a 2.000 entradas (valor filtrável). Por padrão, ele inclui todos os tipos de post e taxonomias públicas, além dos arquivos de autor e da página inicial. Ele fica ativo automaticamente, exceto quando a opção de desencorajar buscadores de indexar o site está marcada nas configurações de leitura, ou quando se usa o filtro wp_sitemaps_enabled para desativá-lo.
Uma observação importante: o sitemap nativo do WordPress não traz as tags changefreq, priority nem lastmod por página, mantendo apenas o essencial. Se você usa um plugin de SEO como Yoast ou All in One SEO, ele tende a desativar o sitemap nativo e servir o seu próprio, geralmente mais configurável e com suporte a imagens.
Como enviar e validar o sitemap no Google
Depois de criar o sitemap, você o disponibiliza ao Google de duas formas principais. A primeira, recomendada, é enviar pelo relatório de Sitemaps do Google Search Console, que mostra quando o Googlebot acessou o arquivo e aponta erros de processamento. A segunda é declarar a localização do sitemap no arquivo robots.txt, com uma linha como Sitemap: https://www.exemplo.com.br/sitemap.xml, que o Google encontra ao rastrear o robots.txt. Para entender como configurar esse arquivo, veja o nosso guia de robots.txt.
O antigo endpoint de ping para o qual era possível enviar sitemaps (a URL google.com/ping?sitemap=) foi descontinuado em junho de 2023 e hoje retorna erro 404, conforme o blog do Google Search Central. Plugins e códigos que ainda tentam usar esse ping não causam problema, mas também não fazem nada de útil. Para validar, use o próprio relatório do Search Console, que sinaliza erros de formato, e garanta que o XML seja bem formado e codificado em UTF-8. Lembre que enviar um sitemap é apenas uma dica e não garante que o Google vá baixar o arquivo nem rastrear todas as URLs.

priority e changefreq: o que o Google usa
O Google ignora completamente as tags <priority> e <changefreq> do sitemap. Isso está escrito na documentação oficial e foi reforçado no blog do Google em 2023, que afirma que o buscador continua sem usar esses dois elementos. A tag priority, na prática, foi tão abusada (sites marcando tudo como 1.0) que perdeu qualquer valor de sinal.
A única tag de metadados que o Google leva em conta é a <lastmod>, e mesmo assim apenas quando o valor é consistente e verificável. Ela deve refletir a data da última alteração significativa da página, como mudança no conteúdo principal, nos dados estruturados ou nos links, e não uma atualização trivial como o ano do rodapé. Se o Google percebe datas de modificação infladas, passa a confiar menos no sitemap inteiro.
Perguntas frequentes sobre sitemap
Sitemap melhora o ranqueamento no Google?
Não. O sitemap é um recurso de descoberta e rastreio, não um fator de ranqueamento. Ele ajuda o Google a encontrar URLs, mas a posição na busca depende de qualidade, relevância e dos sinais de cada página, não da presença no arquivo.
Preciso de sitemap se meu site é pequeno?
Talvez não. O Google considera pequeno um site com cerca de 500 páginas ou menos. Se ele for bem interligado por navegação interna, o Googlebot costuma descobrir tudo sem o sitemap. Ainda assim, manter um não traz prejuízo e pode acelerar a descoberta de páginas novas.
O sitemap garante que minhas páginas serão indexadas?
Não. Enviar um sitemap é apenas uma dica para o buscador. O Google não garante rastrear nem indexar todas as URLs listadas: a decisão depende dos seus algoritmos de rastreio e de qualidade. Páginas rasas ou de baixa qualidade podem simplesmente não ser indexadas.
Qual a diferença entre sitemap e robots.txt?
São arquivos com papéis opostos. O sitemap lista as URLs que você quer que sejam rastreadas e indexadas, enquanto o robots.txt indica aos crawlers quais partes do site não devem ser acessadas. Eles se complementam, e o robots.txt pode inclusive apontar a localização do sitemap.
Posso ter mais de um sitemap no mesmo site?
Sim. Quando o site ultrapassa 50.000 URLs ou 50 MB por arquivo, você divide em vários sitemaps e cria um arquivo de índice que aponta para todos eles. Você pode enviar o índice ao Google, ou enviar sitemaps separados para acompanhar o desempenho de cada grupo no Search Console.
Conclusão
Um arquivo sitemap resolve a etapa de descoberta: ele entrega ao Google uma lista organizada das URLs que você quer ver na busca. Esse reforço importa mais quanto maior, mais novo ou mais mal interligado for o site. Ele não ranqueia nem garante indexação, mas raramente atrapalha. O próximo passo prático é gerar o seu sitemap (o WordPress já faz isso em /wp-sitemap.xml), enviá-lo pelo Search Console e declará-lo no robots.txt. Para avaliar se a rastreabilidade do seu site está em ordem como um todo, vale rodar uma análise de SEO completa.