Gere dados estruturados JSON-LD válidos de Dataset para páginas de dados e publicações de pesquisa. Ajude o Google Dataset Search a descobrir seus conjuntos de dados com nome, descrição e marcação de distribuição adequados.
OneStepToRank monitora seus dados estruturados em produção, avisa quando o schema falha e acompanha como seus resultados ricos mudam ao longo do tempo.
ComeçarSchema de Conjunto de Dados é uma marcação de dados estruturados que informa aos mecanismos de busca que uma página hospeda ou descreve um conjunto de dados. Construído sobre o tipo Dataset do Schema.org, fornece detalhes legíveis por máquina sobre seus dados: o nome, a descrição, o criador, a licença, o formato de arquivo, a URL de download e a cobertura geográfica ou temporal. Quando o Google lê essa marcação, ele indexa seu conjunto de dados no Google Dataset Search, um motor de busca especializado usado por pesquisadores, cientistas de dados, jornalistas e analistas para encontrar dados publicamente disponíveis em toda a web.
Sem o schema de conjunto de dados, sua página de dados fica essencialmente invisível para o Google Dataset Search. Mesmo que seu conjunto de dados apareça nos resultados de busca padrão do Google, ele não será exibido na experiência dedicada de busca de datasets, que cada vez mais impulsiona a descoberta de dados. Dados estruturados são a única forma de garantir que seus conjuntos de dados sejam encontrados pelas pessoas que mais precisam deles.
Publicadores de dados competem por visibilidade em um oceano crescente de conjuntos de dados públicos. Agências governamentais, universidades, laboratórios de pesquisa e empresas publicam milhões de datasets, e a encontrabilidade é o diferencial chave. O schema de dataset dá ao seu dado uma presença estruturada no Google Dataset Search, exibindo nome, criador, licença e descrição em um formato que pesquisadores confiam e reconhecem.
O Google Dataset Search usa dados estruturados de Dataset para alimentar seus resultados de busca e filtros. Usuários podem filtrar por tipo de licença, formato de arquivo, frequência de atualização e cobertura geográfica — mas somente se seu schema incluir esses campos. Páginas com marcação completa de Dataset classificam melhor na Busca de Datasets e dão confiança aos usuários para baixar e usar seus dados. Incluir uma licença clara é especialmente importante, pois pesquisadores precisam saber se podem usar, modificar e redistribuir os dados legalmente antes de investir tempo na análise.
Copie a tag <script type="application/ld+json"> gerada por esta ferramenta e cole-a na seção <head> da sua página de dataset, ou coloque-a antes da tag de fechamento </body>. JSON-LD é o formato preferido do Google para dados estruturados porque é desacoplado do conteúdo visual, facilitando a adição e manutenção sem alterar o layout da página.
Para portais de dados que hospedam muitos datasets, gere JSON-LD dinamicamente a partir do seu banco de metadados. Cada página de dataset deve ter seu próprio schema único com nome, descrição e detalhes de distribuição precisos. Se seus datasets fizerem parte de um catálogo maior (como data.gov ou um repositório universitário), inclua a propriedade includedInDataCatalog para estabelecer essa relação.
Após a implantação, valide sua página ao vivo com o Rich Results Test e verifique diretamente no Google Dataset Search se seu dataset aparece. Use este gerador junto com nosso Local Rank Checker e outras ferramentas SEO gratuitas para construir uma estratégia abrangente de dados estruturados.
A marcação de schema de conjunto de dados é um conjunto de dados estruturados que você adiciona a páginas da web que hospedam ou descrevem datasets. Ela usa o tipo Dataset do Schema.org codificado em JSON-LD, fornecendo detalhes legíveis por máquina como nome, descrição, criador, licença, formato de arquivo e URL de download. Isso permite que seu dataset apareça no Google Dataset Search, tornando‑o descobrível por pesquisadores, cientistas de dados e analistas em todo o mundo.
O Google Dataset Search é um motor de busca especializado que indexa datasets de toda a web. Ele depende fortemente da marcação Schema.org Dataset para descobrir e entender os datasets. Páginas com dados estruturados corretos são elegíveis para aparecer nos resultados do Dataset Search com metadados ricos, incluindo criador, licença, formato e cobertura. Sem essa marcação, seu dataset fica praticamente invisível para esse importante canal de descoberta.
O Google exige, no mínimo, um nome e uma descrição para o schema de Dataset. A descrição deve ter entre 50 e 5000 caracteres e explicar claramente quais dados o conjunto contém, como foram coletados e para que podem ser usados. Campos fortemente recomendados incluem criador, licença, datePublished, distribution (URL de download e formato do arquivo) e palavras‑chave para obter a melhor visibilidade no Dataset Search.
A propriedade license deve conter uma URL apontando para o texto completo da licença sob a qual seu dataset é distribuído. Opções comuns incluem licenças Creative Commons (CC BY 4.0 em https://creativecommons.org/licenses/by/4.0/, CC0 em https://creativecommons.org/publicdomain/zero/1.0/) e licenças Open Data Commons. O Google Dataset Search exibe a licença de forma destacada, portanto escolher uma licença aberta reconhecida torna seu dataset mais atraente para potenciais usuários.