Schema e entidades para IAs
O guia oficial do Google é explícito ao afirmar que dados estruturados não são exigidos pela busca generativa e que não existe markup schema.org especial a adicionar para esse fim. O que o schema faz é outra coisa: construir uma camada legível por máquina que diz o que cada informação da página é e quem responde por ela. Na era da IA, esse é o valor real do schema, e este artigo mostra como implementá-lo sem cair no exagero que o próprio Google desaconselha.
Schema markup garante citação por IA?
Não. O guia de otimização para IA generativa do Google afirma que dados estruturados não são necessários para a busca generativa e que não há schema específico a implementar para aparecer em AI Overviews ou no AI Mode. O guia chega a listar o excesso de foco em dados estruturados para fins de IA entre as práticas que os donos de site podem ignorar, e trata otimização para IA como uma extensão do SEO, não como disciplina separada.
A Microsoft tem ênfase diferente. No texto Optimizing Your Content for Inclusion in AI Search Answers, a empresa afirma que o schema rotula o conteúdo como produto, review, FAQ ou evento, transformando texto puro em dados estruturados que máquinas interpretam com mais confiança.
Em síntese, as duas posições tratam schema como auxílio à compreensão, não como botão de citação. Schema continua sendo útil para SEO em geral e rich results, e ajuda sistemas de IA a entender o conteúdo, mas nenhum tipo de schema garante que sua página será citada em uma resposta gerada.
| Posição oficial | Ênfase sobre schema para IA |
|---|---|
| Google (guia de IA generativa) | Não é exigido, sem markup especial; mantenha para rich results e SEO geral |
| Microsoft (guia de conteúdo para IA) | Útil; rotula conteúdo para máquinas interpretarem com mais confiança |
O papel real do schema na era da IA
Na era da IA, o schema é uma camada de significado. Ele resolve duas perguntas que o texto corrido deixa em aberto para a máquina: o que cada coisa na página é (uma organização, uma pessoa, um curso, um produto) e qual é a relação entre elas. Sem essa camada, o sistema de IA infere o significado de forma probabilística e fica mais sujeito a erro.
Esse papel se conecta diretamente ao grounding. Quando um sistema decide qual evidência usar para construir uma resposta, ele precisa atribuir identidade e origem à informação. Schema fornece exatamente isso de forma explícita: identidade de entidade via propriedades como sameAs e proveniência via autoria e publicador declarados. É o equivalente, na camada de dados, ao que o HTML semântico faz pela operabilidade de agentes de IA.
Visto assim, a pergunta deixa de ser "qual schema me faz ser citado?" e passa a ser "qual schema reduz a ambiguidade sobre quem eu sou e sobre o que estou falando?". A resposta a essa segunda pergunta é o que vale a pena implementar.
O schema mínimo que todo site deveria ter
Quatro tipos de schema fazem a maior parte do trabalho de tornar um site legível para máquinas. Eles cobrem quem publica, o que é cada conteúdo, onde a página fica na estrutura do site e quem assina o texto. O restante do vocabulário Schema.org é situacional e deve ser usado conforme o tipo de página.
| Schema | Onde aplicar | O que diz à máquina |
|---|---|---|
Organization | Home e página institucional | Quem é a organização e como identificá-la |
Article ou BlogPosting | Posts e páginas de conteúdo | O que é o conteúdo, quando foi publicado, quem escreveu |
BreadcrumbList | Páginas com navegação aninhada | Onde a página fica na estrutura do site |
Person | Páginas de autor e bios | Quem é o humano por trás do conteúdo |
Sempre inclua os campos que sinalizam frescor e autoria: datePublished, dateModified, author, publisher e mainEntityOfPage. Prefira JSON-LD: o Google o recomenda por ser o formato mais fácil de implementar e manter em escala e por viver em um bloco separado do HTML visível. Microdata e RDFa continuam válidos e são processados normalmente, mas, por serem atributos embutidos no HTML, quebram com mais facilidade quando o template muda. Valide o resultado antes de publicar. Um exemplo mínimo de BlogPosting para um post deste blog:
{
"@context": "https://schema.org",
"@type": "BlogPosting",
"headline": "Schema e entidades para IA",
"datePublished": "2026-06-15T09:00:00-03:00",
"dateModified": "2026-06-15T09:00:00-03:00",
"author": {
"@type": "Person",
"name": "Thiago Ferrão",
"url": "https://ferraoferrao.com.br/sobre"
},
"publisher": {
"@type": "Organization",
"name": "ferraoferrao SEO",
"logo": {
"@type": "ImageObject",
"url": "https://ferraoferrao.com.br/logo.png"
}
},
"mainEntityOfPage": {
"@type": "WebPage",
"@id": "https://ferraoferrao.com.br/blog/schema-e-entidades-para-ias/"
},
"inLanguage": "pt-BR"
}O que são entidades e por que elas importam mais do que palavras-chave
Uma entidade é uma coisa identificável de forma única (uma pessoa, um lugar, uma organização, um conceito), e não uma sequência de caracteres. "São Paulo" é uma sequência de caracteres; a cidade de São Paulo, o Estado de São Paulo e o santo católico são três entidades distintas que compartilham a mesma sequência de caracteres. Sistemas de busca e de IA trabalham com entidades, não com sequências de caracteres, porque é a entidade que carrega significado estável.
É por isso que o Google entende sinônimos e variações sem que você reescreva o texto para cada uma delas. Inclusive o guia de IA do Google desaconselha reescrever conteúdo para variações de cauda longa justamente porque seus modelos já resolvem significado por entidades. O que o modelo não resolve sozinho é a desambiguação quando há entidades de nome igual ou identidade incerta, e é aí que o markup volta a ser útil.
Bases autoritativas como Wikipedia e Wikidata funcionam como o catálogo público dessas entidades. Vincular a sua entidade ao identificador correto nessas bases é o que transforma uma menção ambígua em uma referência precisa, tanto para o Google quanto para LLMs que usam grounding.
Como desambiguar entidades com sameAs, about e mentions
A desambiguação se faz com três propriedades do Schema.org que têm funções distintas, e usá-las trocadas enfraquece o sinal. A propriedade sameAs declara que a entidade da sua página é a mesma de uma página de referência que identifica sua identidade de forma inequívoca, como a entrada na Wikipedia, o item no Wikidata ou o site oficial. Ela é a forma mais direta de dizer "esta organização é exatamente esta entidade conhecida".
As propriedades about e mentions descrevem o assunto da página, não a identidade do publicador, e a diferença entre elas é de profundidade. Segundo o modelo de dados do Schema.org, about indica o tema principal e pode referenciar mais de uma entidade, enquanto mentions é apropriado para entidades citadas de passagem, sem aprofundamento. Para o tema central de um artigo, use about; para entidades tangenciais, use mentions.
| Propriedade | Função | Quando usar |
|---|---|---|
sameAs | Identidade da entidade | Vincular sua organização, pessoa ou marca à entrada canônica em Wikidata, Wikipedia ou site oficial |
about | Assunto principal | Declarar o tema central da página, uma ou poucas entidades |
mentions | Assunto secundário | Sinalizar entidades citadas sem aprofundamento |
Um exemplo de Organization com sameAs apontando para fontes autoritativas, que é o caso de uso mais comum e de maior retorno:
{
"@context": "https://schema.org",
"@type": "Organization",
"name": "ferraoferrao SEO",
"url": "https://ferraoferrao.com.br",
"sameAs": [
"https://www.wikidata.org/wiki/Q...",
"https://www.linkedin.com/company/...",
"https://github.com/..."
]
}Para conteúdo, declare o assunto da página com about vinculado por sameAs à entidade canônica, o que remove a ambiguidade de nomes iguais:
{
"@context": "https://schema.org",
"@type": "BlogPosting",
"headline": "Schema e entidades para IA",
"about": {
"@type": "Thing",
"name": "Dados estruturados",
"sameAs": "https://www.wikidata.org/wiki/Q1469824"
}
}Proveniência e autoria: o sinal "seguro para citar"
Proveniência é o sinal que ajuda um sistema de IA a decidir se uma informação é segura para citar. Autoria identificada, credenciais verificáveis e identidade vinculada a perfis profissionais dizem de onde a informação vem, e a Microsoft é explícita ao ligar estrutura e autoria à confiança com que sistemas de IA interpretam o conteúdo. Um texto pode estar correto e ainda assim não ser citado se a máquina não consegue atribuir-lhe uma origem confiável.
Na prática, isso significa tratar a autoria como parte da fundação do schema, não como detalhe final. Crie uma página de autor dedicada, marque-a com Person e use sameAs para vincular o autor a perfis externos que confirmam sua identidade e expertise. Os campos jobTitle, worksFor e knowsAbout adicionam contexto que o Google associa a sinais de E-E-A-T (experiência, expertise, autoridade e confiabilidade).
{
"@context": "https://schema.org",
"@type": "Person",
"name": "Thiago Ferrão",
"url": "https://ferraoferrao.com.br/sobre",
"jobTitle": "Consultor de SEO Técnico",
"knowsAbout": ["SEO técnico", "GEO", "Core Web Vitals", "Schema markup"],
"sameAs": [
"https://www.linkedin.com/in/...",
"https://github.com/..."
]
}No artigo, conecte o author do Article ou BlogPosting a essa mesma entidade Person, para que a identidade do autor seja consistente em todas as páginas. Essa consistência é o que permite a um sistema de grounding reconhecer o autor como a mesma entidade ao longo do site.
Como validar e medir schema e entidades
Validação e medição são etapas distintas, e nenhuma das duas é opcional. Para validar a sintaxe e a elegibilidade a rich results, use o validador do Schema.org e o Teste de Resultados Aprimorados do Google. Eles apontam erros de sintaxe, campos obrigatórios ausentes e tipos mal aninhados antes da publicação.
Para medir o efeito sobre a visibilidade em IA, a Microsoft passou a oferecer dados de citação reais. O recurso AI Performance do Bing Webmaster Tools, em preview público desde fevereiro de 2026, mostra total de citações, páginas citadas e queries de grounding, indicando como o Copilot está de fato usando o seu conteúdo. É um dos poucos sinais primários de citação por IA disponíveis hoje.
No lado do Google, a medição se divide em duas superfícies. O tráfego de assistentes de IA externos passou a ter um canal nativo AI Assistant no GA4 desde maio de 2026, ainda que ele meça o clique e não a citação. Já as citações em AI Overviews seguem somadas ao orgânico no Search Console, e o relatório de IA generativa lançado em junho de 2026 isola apenas impressões, não cliques. Ferramentas que avaliam citabilidade, como o GEO Check, ajudam a estimar o quão legível e citável uma página está antes de a citação acontecer, fechando a lacuna entre validar o markup e observar o resultado.
Perguntas frequentes sobre schema e entidades para IA
Schema markup é obrigatório para aparecer em respostas de IA?
Não. O guia oficial do Google afirma que dados estruturados não são exigidos pela busca generativa e que não há markup especial para IA. Schema continua útil para rich results, para SEO geral e para ajudar máquinas a entender e desambiguar o conteúdo, mas não é pré-requisito nem garantia de citação.
Qual schema é mais importante para ser citado por IA?
Não existe um schema que dispare citação. Os que mais contribuem para a compreensão e a confiança são Organization e Person com sameAs para identidade e proveniência, e Article ou BlogPosting com autoria e datas. A prioridade é reduzir ambiguidade sobre quem você é e sobre o que a página trata.
O que é a propriedade sameAs e para que serve?
Segundo o Schema.org, sameAs é a URL de uma página de referência que indica de forma inequívoca a identidade de uma entidade, como a entrada na Wikipedia, o item no Wikidata ou o site oficial. Ela serve para vincular a sua organização, pessoa ou marca à entidade canônica conhecida, eliminando confusão entre nomes iguais.
Qual a diferença entre about, mentions e sameAs?
sameAs declara identidade: a entidade da página é a mesma de uma fonte externa. about declara o assunto principal da página e pode citar mais de uma entidade. mentions sinaliza entidades citadas de passagem, sem aprofundamento. As duas primeiras carregam mais peso semântico que mentions.
Como sei se uma IA está citando meu site?
Pelo lado da Microsoft, o AI Performance do Bing Webmaster Tools mostra citações, páginas citadas e queries de grounding desde fevereiro de 2026. Pelo lado do Google, o tráfego de assistentes externos aparece no canal nativo AI Assistant do GA4 desde maio de 2026, enquanto as citações em AI Overviews continuam somadas ao orgânico no Search Console; o relatório de IA generativa de junho de 2026 isola apenas impressões, não cliques.
Schema serve para ChatGPT e Perplexity ou só para o Google?
Schema é um vocabulário neutro de plataforma. Ele ajuda qualquer sistema que leia a página a entender entidades e proveniência, incluindo experiências baseadas no índice do Bing, que alimenta parte do ecossistema de IA. O benefício não é exclusivo do Google, ainda que cada plataforma use os dados de forma própria.
Conclusão
O erro mais comum sobre schema na era da IA é tratá-lo como botão de citação. A documentação primária do Google e da Microsoft aponta para um papel mais sóbrio e mais durável: schema é a camada que declara identidade de entidade e proveniência, reduzindo a ambiguidade que um sistema de IA teria de resolver no chute. Implemente o mínimo bem feito, vincule suas entidades a fontes autoritativas com sameAs e trate autoria como fundação, não enfeite.
O próximo passo lógico é entender o quadro maior de como as IAs selecionam o que citam, do qual o schema é apenas uma camada. Esse panorama está no pilar sobre citabilidade e extração por IAs.