Générez des données structurées JSON-LD de jeu de données valides pour les pages de données et les publications de recherche. Aidez Google Dataset Search à découvrir vos jeux de données grâce à des balises de nom, description et distribution appropriées.
OneStepToRank surveille vos données structurées en production, vous alerte lorsqu’un schéma se casse et suit l’évolution de vos résultats enrichis au fil du temps.
CommencerLe schéma de jeu de données est une balise de données structurées qui indique aux moteurs de recherche qu’une page héberge ou décrit un jeu de données. Basé sur le type Dataset de Schema.org, il fournit des détails lisibles par machine sur vos données : le nom, la description, le créateur, la licence, le format de fichier, l’URL de téléchargement et la couverture géographique ou temporelle. Lorsque Google lit cette balise, il indexe votre jeu de données dans Google Dataset Search, un moteur de recherche spécialisé utilisé par les chercheurs, les data scientists, les journalistes et les analystes pour trouver des données publiques disponibles sur le Web.
Sans schéma de jeu de données, votre page de données est pratiquement invisible pour Google Dataset Search. Même si votre jeu de données apparaît dans la recherche Google classique, il n’apparaîtra pas dans l’expérience de recherche dédiée aux jeux de données qui favorise de plus en plus la découverte de données. Les données structurées sont le seul moyen de garantir que vos jeux de données soient trouvés par les personnes qui en ont le plus besoin.
Les éditeurs de données se disputent la visibilité dans un océan croissant de jeux de données publics. Les agences gouvernementales, les universités, les laboratoires de recherche et les entreprises publient des millions de jeux de données, et la découvrabilité est le facteur différenciant clé. Le schéma de jeu de données donne à vos données une présence structurée dans Google Dataset Search, affichant le nom du jeu de données, le créateur, la licence et la description dans un format que les chercheurs reconnaissent et en lequel ils ont confiance.
Google Dataset Search utilise les données structurées de type Dataset pour alimenter ses résultats de recherche et filtres. Les utilisateurs peuvent filtrer par type de licence, format de fichier, fréquence de mise à jour et couverture géographique — mais uniquement si votre schéma inclut ces champs. Les pages avec un balisage complet de Dataset sont mieux classées dans Dataset Search et offrent aux utilisateurs la confiance nécessaire pour télécharger et utiliser vos données. Inclure une licence claire est particulièrement important, car les chercheurs doivent savoir s’ils peuvent légalement utiliser, modifier et redistribuer les données avant d’investir du temps dans l’analyse.
Copiez la balise script JSON-LD générée par cet outil et collez‑la dans la section <head> de votre page de jeu de données, ou placez‑la avant la balise de fermeture </body>. JSON-LD est le format préféré de Google pour les données structurées car il est découplé du contenu visuel, ce qui le rend facile à ajouter et à maintenir sans modifier la mise en page de votre page.
Pour les portails de données hébergeant de nombreux jeux de données, générez le JSON-LD dynamiquement à partir de votre base de métadonnées. Chaque page de jeu de données doit disposer de son propre schéma unique avec un nom, une description et des détails de distribution précis. Si vos jeux de données font partie d’un catalogue plus large (comme data.gov ou un dépôt universitaire), incluez la propriété includedInDataCatalog pour établir cette relation.
Après le déploiement, validez votre page en direct avec le Test des résultats enrichis et consultez directement Google Dataset Search pour confirmer que votre jeu de données apparaît. Utilisez ce générateur avec notre Vérificateur de rang local et d’autres outils SEO gratuits pour élaborer une stratégie complète de données structurées.
La balise de schéma de jeu de données est une donnée structurée que vous ajoutez aux pages web qui hébergent ou décrivent des jeux de données. Elle utilise le type Dataset de Schema.org encodé au format JSON-LD, fournissant des détails lisibles par machine tels que le nom du jeu de données, la description, le créateur, la licence, le format de fichier et l’URL de téléchargement. Cela permet à votre jeu de données d’apparaître dans Google Dataset Search, le rendant découvrable par les chercheurs, les data scientists et les analystes du monde entier.
Google Dataset Search est un moteur de recherche spécialisé qui indexe les jeux de données provenant du Web. Il repose fortement sur la balise Schema.org Dataset pour découvrir et comprendre les jeux de données. Les pages disposant d’un balisage structuré de Dataset approprié sont éligibles pour apparaître dans les résultats de Dataset Search avec des métadonnées riches incluant le créateur, la licence, le format et la couverture. Sans cette balise, votre jeu de données est pratiquement invisible pour ce canal de découverte important.
Google exige au minimum un nom et une description pour le schéma de jeu de données. La description doit comporter entre 50 et 5000 caractères et expliquer clairement quelles données le jeu de données contient, comment elles ont été collectées et à quoi elles peuvent servir. Les champs fortement recommandés incluent le créateur, la licence, datePublished, la distribution (avec l’URL de téléchargement et le format de fichier) et les mots‑clés pour une meilleure visibilité dans Dataset Search.
La propriété license doit contenir une URL pointant vers le texte complet de la licence sous laquelle votre jeu de données est distribué. Les options courantes incluent les licences Creative Commons telles que CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/) et CC0 (https://creativecommons.org/publicdomain/zero/1.0/), ainsi que les licences Open Data Commons. Google Dataset Search affiche la licence de manière visible, de sorte qu’une licence ouverte bien connue rend votre jeu de données plus accessible et attrayant pour les utilisateurs potentiels.