Gerador Gratuito de Schema de Conjunto de Dados - JSON-LD | OneStepToRank

Gerador de Schema de Conjunto de Dados

Gere dados estruturados JSON-LD válidos de Dataset para páginas de dados e publicações de pesquisa. Ajude o Google Dataset Search a descobrir seus conjuntos de dados com nome, descrição e marcação de distribuição adequados.

Construa Seu Schema de Conjunto de Dados

Quer Monitoramento de Schema Automatizado?

OneStepToRank monitora seus dados estruturados em produção, avisa quando o schema falha e acompanha como seus resultados ricos mudam ao longo do tempo.

Começar

O que é Schema de Conjunto de Dados?

Schema de Conjunto de Dados é uma marcação de dados estruturados que informa aos mecanismos de busca que uma página hospeda ou descreve um conjunto de dados. Construído sobre o tipo Dataset do Schema.org, fornece detalhes legíveis por máquina sobre seus dados: o nome, a descrição, o criador, a licença, o formato de arquivo, a URL de download e a cobertura geográfica ou temporal. Quando o Google lê essa marcação, ele indexa seu conjunto de dados no Google Dataset Search, um motor de busca especializado usado por pesquisadores, cientistas de dados, jornalistas e analistas para encontrar dados publicamente disponíveis em toda a web.

Sem o schema de conjunto de dados, sua página de dados fica essencialmente invisível para o Google Dataset Search. Mesmo que seu conjunto de dados apareça nos resultados de busca padrão do Google, ele não será exibido na experiência dedicada de busca de datasets, que cada vez mais impulsiona a descoberta de dados. Dados estruturados são a única forma de garantir que seus conjuntos de dados sejam encontrados pelas pessoas que mais precisam deles.

Por que Conjuntos de Dados Precisam de Dados Estruturados

Publicadores de dados competem por visibilidade em um oceano crescente de conjuntos de dados públicos. Agências governamentais, universidades, laboratórios de pesquisa e empresas publicam milhões de datasets, e a encontrabilidade é o diferencial chave. O schema de dataset dá ao seu dado uma presença estruturada no Google Dataset Search, exibindo nome, criador, licença e descrição em um formato que pesquisadores confiam e reconhecem.

O Google Dataset Search usa dados estruturados de Dataset para alimentar seus resultados de busca e filtros. Usuários podem filtrar por tipo de licença, formato de arquivo, frequência de atualização e cobertura geográfica — mas somente se seu schema incluir esses campos. Páginas com marcação completa de Dataset classificam melhor na Busca de Datasets e dão confiança aos usuários para baixar e usar seus dados. Incluir uma licença clara é especialmente importante, pois pesquisadores precisam saber se podem usar, modificar e redistribuir os dados legalmente antes de investir tempo na análise.

Propriedades Principais no Schema de Conjunto de Dados

  • name -- O título do conjunto de dados. Obrigatório pelo Google.
  • description -- Uma descrição detalhada do conjunto de dados (50-5000 caracteres). Obrigatório pelo Google. Deve explicar quais dados estão incluídos, como foram coletados e os usos pretendidos.
  • creator -- A pessoa ou organização que criou o conjunto de dados. Pode ser um Person ou Organization com uma URL opcional.
  • license -- Uma URL apontando para a licença sob a qual o conjunto de dados é distribuído (ex.: Creative Commons, Open Data Commons).
  • distribution -- Um objeto DataDownload especificando o formato do arquivo, a URL de download e o tamanho do conteúdo.
  • keywords -- Um array de palavras‑chave descritivas para ajudar os usuários a encontrar o conjunto de dados.
  • spatialCoverage -- A área geográfica que o conjunto de dados cobre.
  • temporalCoverage -- O período de tempo que o conjunto de dados cobre, no formato de intervalo ISO 8601.

Como Adicionar Schema de Conjunto de Dados ao Seu Site

Copie a tag <script type="application/ld+json"> gerada por esta ferramenta e cole-a na seção <head> da sua página de dataset, ou coloque-a antes da tag de fechamento </body>. JSON-LD é o formato preferido do Google para dados estruturados porque é desacoplado do conteúdo visual, facilitando a adição e manutenção sem alterar o layout da página.

Para portais de dados que hospedam muitos datasets, gere JSON-LD dinamicamente a partir do seu banco de metadados. Cada página de dataset deve ter seu próprio schema único com nome, descrição e detalhes de distribuição precisos. Se seus datasets fizerem parte de um catálogo maior (como data.gov ou um repositório universitário), inclua a propriedade includedInDataCatalog para estabelecer essa relação.

Após a implantação, valide sua página ao vivo com o Rich Results Test e verifique diretamente no Google Dataset Search se seu dataset aparece. Use este gerador junto com nosso Local Rank Checker e outras ferramentas SEO gratuitas para construir uma estratégia abrangente de dados estruturados.

Perguntas Frequentes

O que é marcação de schema de conjunto de dados?

A marcação de schema de conjunto de dados é um conjunto de dados estruturados que você adiciona a páginas da web que hospedam ou descrevem datasets. Ela usa o tipo Dataset do Schema.org codificado em JSON-LD, fornecendo detalhes legíveis por máquina como nome, descrição, criador, licença, formato de arquivo e URL de download. Isso permite que seu dataset apareça no Google Dataset Search, tornando‑o descobrível por pesquisadores, cientistas de dados e analistas em todo o mundo.

Como o schema de conjunto de dados ajuda no Google Dataset Search?

O Google Dataset Search é um motor de busca especializado que indexa datasets de toda a web. Ele depende fortemente da marcação Schema.org Dataset para descobrir e entender os datasets. Páginas com dados estruturados corretos são elegíveis para aparecer nos resultados do Dataset Search com metadados ricos, incluindo criador, licença, formato e cobertura. Sem essa marcação, seu dataset fica praticamente invisível para esse importante canal de descoberta.

Quais campos são obrigatórios para o schema de conjunto de dados?

O Google exige, no mínimo, um nome e uma descrição para o schema de Dataset. A descrição deve ter entre 50 e 5000 caracteres e explicar claramente quais dados o conjunto contém, como foram coletados e para que podem ser usados. Campos fortemente recomendados incluem criador, licença, datePublished, distribution (URL de download e formato do arquivo) e palavras‑chave para obter a melhor visibilidade no Dataset Search.

Qual licença devo especificar no schema de conjunto de dados?

A propriedade license deve conter uma URL apontando para o texto completo da licença sob a qual seu dataset é distribuído. Opções comuns incluem licenças Creative Commons (CC BY 4.0 em https://creativecommons.org/licenses/by/4.0/, CC0 em https://creativecommons.org/publicdomain/zero/1.0/) e licenças Open Data Commons. O Google Dataset Search exibe a licença de forma destacada, portanto escolher uma licença aberta reconhecida torna seu dataset mais atraente para potenciais usuários.