Seu site está pronto para agentes de IA? O que o Google recomenda

SEO TécnicoPublicado em 11/05/2026Atualizado em 15/06/20268 min de leitura

Agentes de IA não navegam como humanos. Eles leem seu site via HTML, árvore de acessibilidade e capturas de tela, e muitos sites, mesmo bem ranqueados, são funcionalmente quebrados para esses sistemas.

O Google publicou no web.dev um guia bem direto sobre o que chama de "sites compatíveis com agentes" e em junho de 2026 o guia oficial de otimização para IA generativa do Search Central incorporou uma seção dedicada a experiências agênticas. Ou seja, preparar o site para agentes passou a fazer parte da documentação oficial da Busca. O ponto central segue o mesmo: o que torna um site legível por agentes é o mesmo que sempre tornou um site tecnicamente bem feito.

Como um agente enxerga seu site

Antes de falar em otimização, vale entender como esses sistemas percebem uma página. Agentes modernos combinam três fontes de leitura:

HTML bruto: o agente analisa o código da página e entende como os elementos se relacionam entre si. Se um botão "Comprar agora" está dentro do bloco de um produto, o agente conclui que ele pertence àquele produto específico. A estrutura do código importa tanto quanto o conteúdo visível.

Árvore de acessibilidade: é como um "resumo funcional" da página, gerado automaticamente pelo navegador. Ele filtra tudo o que é puramente visual, como cores, fontes e animações e mantém só o que é funcionalmente relevante: quais elementos existem, o que cada um faz e em que estado se encontra (um botão está ativo? um campo está preenchido?). Para o agente, é como um mapa limpo da página. O problema: elementos mal construídos simplesmente não aparecem nesse mapa. Um <div> estilizado para parecer um botão, por exemplo, não é reconhecido como botão e o agente não vai conseguir clicar nele.

Capturas de tela: quando as duas fontes anteriores não são suficientes, o agente faz uma captura visual da página renderizada e usa visão computacional para identificar elementos. É útil para captar informações visuais como tamanho, cor e posição, mas é lento e consome muito processamento. Funciona como último recurso.

O problema começa quando esses três canais dão informações contraditórias ou incompletas. Um elemento mal construído pode aparecer visualmente na tela, mas ser invisível para o agente na camada de código. Um <div> sem role não aparece na árvore de acessibilidade. A captura de tela pode localizá-lo na tela, mas não sabe o que ele faz. O resultado é ambiguidade e agentes, como modelos de linguagem, resolvem ambiguidade com chute ou simplesmente falham na tarefa..

O que consertar, na prática

O guia do Google lista as intervenções mais diretas:

Use os elementos HTML certos. Prefira <button> e <a> em vez de <div> ou <span> disfarçados de botão ou link. Se por algum motivo não for possível, sinalize explicitamente a função do elemento no código: <div role="button" tabindex="0">.
Vincule rótulos aos campos de formulário. O atributo for no <label> cria uma ligação semântica entre o nome do campo e o campo em si, que o agente usa para entender o que cada campo pede antes de preenchê-lo.
Indique visualmente o que é clicável. O CSS cursor: pointer nos elementos interativos é um sinal explícito que agentes de visão reconhecem como "este elemento faz alguma coisa".
Mantenha layout estável. Agentes que fazem screenshots ficam confusos quando o posicionamento de elementos muda entre páginas. Um botão "Adicionar ao carrinho" em lugares diferentes para cada categoria de produto é um exemplo claro de quebra.
Evite sobreposições e elementos "fantasma". Sobreposições transparentes que cobrem elementos interativos podem fazer o agente ignorar o elemento que está por baixo.
Garanta tamanho mínimo nos elementos interativos. Elementos clicáveis menores que 8×8 pixels tendem a ser ignorados na análise visual.

E quando o agente nem precisa navegar? A camada de protocolo

Existe um segundo caminho para a operabilidade por agentes, e ele não passa pela interface do site. Em janeiro de 2026, o Google anunciou o Universal Commerce Protocol (UCP), um padrão aberto co-desenvolvido com Shopify, Etsy, Wayfair e Target e endossado por mais de 20 empresas de varejo e pagamentos que permite a agentes de IA conduzir toda a jornada de compra via API: descoberta de produto, carrinho, checkout e pós-venda. O protocolo é compatível com os padrões já estabelecidos do ecossistema agêntico, como o Agent2Agent (A2A), o Agent Payments Protocol (AP2) e o Model Context Protocol (MCP).

Na prática, o UCP já alimenta um checkout direto em listagens de produtos elegíveis no AI Mode da Busca e no Gemini, e o lojista continua sendo o vendedor registrado da transação. Em abril de 2026, o protocolo ganhou carrinho com múltiplos itens, consulta de preço e estoque em tempo real e vinculação de identidade para programas de fidelidade, com onboarding simplificado pelo Merchant Center. O guia do Search Central cita o UCP nominalmente como o tipo de protocolo emergente que vai permitir aos agentes da Busca fazer mais. Na mesma linha, o Google passou a oferecer o Business Agent, uma experiência conversacional na própria Busca em que o cliente conversa diretamente com a marca.

Para conteúdo, serviços e fluxos sem integração, vale o caminho deste artigo: o agente navega a interface, e o site precisa ser legível via HTML, árvore de acessibilidade e screenshot. Para e-commerce, está surgindo um caminho programático em que a transação acontece via protocolo e feed estruturado, sem que o agente sequer "veja" a página. A interface operável atende os browser agents de hoje e o feed e o protocolo atendem o checkout agêntico que o Google já está colocando em produção. Quem vende online vai precisar dos dois.

Por que isso importa para AEO/GEO

Em maio de 2026, a equipe de IA da Microsoft publicou um texto técnico que afirma que o índice da busca está se dividindo em dois sistemas com a mesma base mas otimizações distintas: a busca tradicional, otimizada para "qual página o usuário deveria visitar?", e o grounding, otimizado para "qual evidência o sistema de IA pode usar para construir uma resposta?". É a mesma infraestrutura sustentando dois usos diferentes.

Para o produtor de conteúdo, isso reforça o ponto de que HTML semântico, dados estruturados e proveniência clara deixam de ser detalhes de qualidade técnica e passam a ser pré-requisitos para entrar na nova camada da busca. A diferença é que antes isso acontecia na indexação de forma passiva, e agora, com agentes agindo em nome do usuário, o site precisa ser operável por máquina em tempo real.

A camada que o agente lê por baixo da interface: dados estruturados e proveniência

Se o grounding pergunta "qual evidência o sistema pode usar?", a resposta depende de duas coisas que a interface visual não entrega: o que cada informação é e quem responde por ela. Aqui os dados estruturados e a proveniência entram não como um "hack" de ranqueamento, mas como a camada legível por máquina que reduz a ambiguidade que o agente teria de resolver no chute.

Mas o schema apenas não garante citação por IA. O guia do Google é explícito ao dizer que dados estruturados não são exigidos pela busca generativa e que não existe markup especial para IA. Ainda que eles sigam úteis para a estratégia geral de SEO e para rich results, não são um gatilho de citação. A Microsoft dá mais peso ao schema, afirmando que ele rotula o conteúdo de forma que máquinas interpretam com mais confiança. Desse modo, o papel do schema mudou de alavanca de ranqueamento para camada de entidades e proveniência.

Proveniência é o sinal que decide se uma evidência é "segura para citar". Autoria identificada, credenciais verificáveis e identidade de entidade vinculada a fontes autoritativas dizem ao sistema de grounding de onde a informação vem, o equivalente, na web agêntica, ao que a árvore de acessibilidade faz pela operabilidade. Um conteúdo pode estar visível na resposta e ainda assim não ser citado se a máquina não consegue atribuir-lhe uma origem confiável.

Para o produtor de conteúdo, a consequência prática é que HTML semântico (para o agente agir), redação estruturada (para o trecho ser extraído) e dados estruturados com proveniência clara (para a evidência ser confiável) são três camadas distintas que resolvem três problemas distintos.

Um site que um agente não consegue navegar não vai gerar conversão via IA, mesmo que apareça na resposta. Visibilidade sem operabilidade não completa o ciclo.

Um bom ponto de partida é auditar a árvore de acessibilidade da sua página direto no Chrome DevTools (aba Accessibility). O que você encontrar lá é exatamente o que um agente encontra. Tudo o que estiver faltando, mal nomeado ou ambíguo é um ponto cego operacional.

Conclusão

Os profissionais que vão sair na frente na próxima fase da busca são os que já tratam agentes como uma audiência real. HTML semântico limpo, acessibilidade bem implementada, layouts estáveis e hierarquia visual clara deixaram de ser só boas práticas de UX. Na web agêntica, é disso que depende a rastreabilidade.