データページや研究出版物向けに有効な Dataset JSON-LD 構造化データを生成します。適切な名前、説明、配布情報のマークアップで Google Dataset Search にデータセットを見つけてもらいましょう。
データセット スキーマ は、検索エンジンにページがデータセットをホストまたは説明していることを伝える構造化データマークアップです。Schema.org Dataset タイプ に基づき、データの名前、説明、作成者、ライセンス、ファイル形式、ダウンロード URL、地理的または時間的カバレッジといった機械可読の詳細を提供します。Google がこのマークアップを読み取ると、データセットは Google Dataset Search にインデックスされ、研究者、データサイエンティスト、ジャーナリスト、アナリストがウェブ上の公開データを検索できる専門検索エンジンで表示されます。
データセット スキーマがないと、データページは実質的に Google Dataset Search から見えなくなります。たとえデータセットが通常の Google 検索でランク付けされても、データ発見を促進する専用のデータセット検索には表示されません。構造化データは、データセットを必要とする人々に見つけてもらう唯一の方法です。
データ提供者は、増え続ける公開データの海の中で可視性を争っています。政府機関、大学、研究所、企業は何百万ものデータセットを公開しており、発見可能性が重要な差別化要因です。データセット スキーマは、Google Dataset Search においてデータに 構造化された存在 を提供し、データセット名、作成者、ライセンス、説明を研究者が信頼し認識できる形式で表示します。
Google Dataset Search はデータセット構造化データを利用して 検索結果とフィルターを提供します。ユーザーはライセンスタイプ、ファイル形式、更新頻度、地理的カバレッジでフィルタリングできますが、これらのフィールドがスキーマに含まれている場合に限ります。完全なデータセット マークアップを持つページは Dataset Search で上位に表示され、ユーザーはデータをダウンロード・利用する際の信頼感を得られます。特に 明確なライセンス の記載は重要で、研究者はデータを合法的に使用、変更、再配布できるかを確認した上で分析に時間を投資します。
このツールで生成された JSON-LD スクリプトタグをコピーし、データセットページの <head> セクションに貼り付けるか、閉じる </body> タグの直前に配置してください。JSON-LD は視覚コンテンツから分離された Google 推奨の構造化データ形式で、ページレイアウトを変更せずに簡単に追加・維持できます。
多数のデータセットをホストするデータポータルでは、メタデータデータベースから動的に JSON-LD を生成してください。各データセットページは、正確な名前、説明、配布情報を含む固有のスキーマを持つべきです。データセットが大規模カタログ(例: data.gov や大学リポジトリ)の一部である場合、includedInDataCatalog プロパティを追加して関係性を示します。
デプロイ後は、Rich Results Test でライブページを検証し、Google Dataset Search で直接データセットが表示されるか確認してください。このジェネレーターは ローカルランクチェッカー や他の 無料 SEO ツール と併用して、包括的な構造化データ戦略を構築しましょう。
データセット スキーママークアップは、データセットをホストまたは説明するウェブページに追加する構造化データです。Schema.org の Dataset タイプを JSON-LD 形式でエンコードし、データセット名、説明、作成者、ライセンス、ファイル形式、ダウンロード URL など機械可読の詳細を提供します。これによりデータセットは Google Dataset Search に表示され、世界中の研究者、データサイエンティスト、アナリストに発見されやすくなります。
Google Dataset Search はウェブ全体のデータセットをインデックスする専門検索エンジンです。データセットを発見・理解するために Schema.org Dataset マークアップに大きく依存しています。適切なデータセット構造化データを持つページは、作成者、ライセンス、形式、カバレッジなどのリッチメタデータと共に Dataset Search の結果に表示される資格があります。このマークアップがないと、データセットは事実上この重要な発見チャネルから見えなくなります。
Google はデータセット スキーマに最低でも名前と説明を必須としています。説明は 50〜5000 文字で、データセットに含まれるデータ、収集方法、利用目的を明確に説明する必要があります。推奨されるフィールドとして、作成者、ライセンス、datePublished、distribution(ダウンロード URL とファイル形式を含む)、キーワードがあり、これらを設定すると Dataset Search での可視性が向上します。
license プロパティには、データセットが配布されるライセンス全文への URL を指定します。一般的な選択肢として、CC BY 4.0(https://creativecommons.org/licenses/by/4.0/)や CC0(https://creativecommons.org/publicdomain/zero/1.0/)などの Creative Commons ライセンス、Open Data Commons ライセンス、または組織独自のデータライセンスがあります。Google Dataset Search はライセンスを目立つ形で表示するため、広く認知されたオープンライセンスを選ぶことでデータセットの利用しやすさと魅力度が高まります。