무료 데이터셋 스키마 생성기 - JSON-LD | OneStepToRank

데이터셋 스키마 생성기

데이터 페이지와 연구 출판물을 위한 유효한 Dataset JSON-LD 구조화 데이터를 생성합니다. 적절한 이름, 설명 및 배포 마크업으로 Google Dataset Search가 귀하의 데이터셋을 발견하도록 돕습니다.

데이터셋 스키마 만들기

자동화된 스키마 모니터링을 원하시나요?

OneStepToRank는 프로덕션 환경에서 구조화 데이터를 모니터링하고, 스키마가 깨질 때 알림을 제공하며, 풍부한 결과가 시간에 따라 어떻게 변하는지 추적합니다.

시작하기

데이터셋 스키마란?

Dataset schema는 페이지가 데이터셋을 호스팅하거나 설명한다는 것을 검색 엔진에 알려주는 구조화 데이터 마크업입니다. Schema.org Dataset 유형을 기반으로 하며, 데이터의 이름, 설명, 제작자, 라이선스, 파일 형식, 다운로드 URL 및 지리적·시간적 범위와 같은 기계 판독 가능한 세부 정보를 제공합니다. Google이 이 마크업을 읽으면 Google Dataset Search에 데이터셋을 색인화합니다. 이는 연구자, 데이터 과학자, 저널리스트 및 분석가가 웹 전역의 공개 데이터를 찾는 데 사용하는 특화된 검색 엔진입니다.

Dataset schema가 없으면 데이터 페이지는 사실상 Google Dataset Search에 보이지 않습니다. 일반 Google 검색에서 데이터셋이 순위에 오르더라도, 데이터 발견을 주도하는 전용 데이터셋 검색 환경에는 나타나지 않습니다. 구조화 데이터는 귀하의 데이터셋이 가장 필요로 하는 사람들에게 발견되도록 보장하는 유일한 방법입니다.

왜 데이터셋에 구조화 데이터가 필요한가

데이터 제공자는 늘어나는 공개 데이터셋의 바다에서 가시성을 놓고 경쟁합니다. 정부 기관, 대학, 연구소, 기업이 수백만 개의 데이터셋을 공개하며, 발견 가능성이 핵심 차별화 요소입니다. Dataset schema는 Google Dataset Search에서 귀하의 데이터에 구조화된 존재감을 부여하여, 연구자들이 신뢰하고 인식하는 형식으로 데이터셋 이름, 제작자, 라이선스 및 설명을 표시합니다.

Google Dataset Search는 Dataset 구조화 데이터를 활용해 검색 결과 및 필터를 제공합니다. 사용자는 라이선스 유형, 파일 형식, 업데이트 빈도, 지리적 범위 등으로 필터링할 수 있지만, 이는 스키마에 해당 필드가 포함된 경우에만 가능합니다. 완전한 Dataset 마크업을 가진 페이지는 Dataset Search에서 더 높은 순위를 차지하고, 사용자가 데이터를 다운로드하고 활용할 신뢰를 제공합니다. 특히 명확한 라이선스를 포함하는 것이 중요한데, 연구자는 데이터를 법적으로 사용할 수 있는지 여부를 알아야 하기 때문입니다.

Dataset 스키마의 주요 속성

  • name -- 데이터셋의 제목. Google에서 요구합니다.
  • description -- 데이터셋에 대한 상세 설명(50-5000자). Google에서 요구합니다. 포함된 데이터, 수집 방법, 사용 목적을 설명해야 합니다.
  • creator -- 데이터셋을 만든 사람 또는 조직. Person 또는 Organization 형태이며 선택적 URL을 포함할 수 있습니다.
  • license -- 데이터셋이 배포되는 라이선스(예: Creative Commons, Open Data Commons)를 가리키는 URL.
  • distribution -- 파일 형식, 다운로드 URL 및 콘텐츠 크기를 지정하는 DataDownload 객체.
  • keywords -- 사용자가 데이터셋을 찾을 수 있도록 돕는 설명적 키워드 배열.
  • spatialCoverage -- 데이터셋이 다루는 지리적 영역.
  • temporalCoverage -- ISO 8601 구간 형식으로 표현된 데이터셋이 다루는 기간.

웹사이트에 Dataset 스키마 추가 방법

이 도구에서 생성된 JSON-LD 스크립트 태그를 복사하여 데이터셋 페이지의 <head> 섹션에 붙여넣거나, 닫는 </body> 태그 앞에 배치하세요. JSON-LD는 시각적 콘텐츠와 분리되어 있어 페이지 레이아웃을 변경하지 않고도 쉽게 추가·유지 관리할 수 있기 때문에 Google이 선호하는 구조화 데이터 형식입니다.

많은 데이터셋을 호스팅하는 데이터 포털의 경우, 메타데이터 데이터베이스에서 동적으로 JSON-LD를 생성하세요. 각 데이터셋 페이지는 정확한 이름, 설명 및 배포 세부 정보를 포함한 고유한 스키마를 가져야 합니다. 데이터셋이 더 큰 카탈로그(예: data.gov 또는 대학 리포지터리)의 일부라면 includedInDataCatalog 속성을 포함하여 해당 관계를 설정하세요.

배포 후, Rich Results Test로 실시간 페이지를 검증하고, Google Dataset Search에서 직접 확인하여 데이터셋이 표시되는지 확인하세요. 이 생성기를 Local Rank Checker 및 기타 무료 SEO 도구와 함께 사용하여 포괄적인 구조화 데이터 전략을 구축하세요.

자주 묻는 질문

Dataset 스키마 마크업이란 무엇인가요?

Dataset 스키마 마크업은 데이터셋을 호스팅하거나 설명하는 웹 페이지에 추가하는 구조화 데이터입니다. JSON-LD 형식으로 인코딩된 Schema.org Dataset 유형을 사용하여 데이터셋 이름, 설명, 제작자, 라이선스, 파일 형식 및 다운로드 URL과 같은 기계 판독 가능한 세부 정보를 제공합니다. 이를 통해 데이터셋이 Google Dataset Search에 표시되어 전 세계 연구자, 데이터 과학자 및 분석가가 발견할 수 있게 됩니다.

Dataset 스키마가 Google Dataset Search에 어떻게 도움이 되나요?

Google Dataset Search는 웹 전역의 데이터셋을 색인화하는 특화된 검색 엔진입니다. 데이터셋을 발견하고 이해하기 위해 Schema.org Dataset 마크업에 크게 의존합니다. 적절한 Dataset 구조화 데이터를 가진 페이지는 제작자, 라이선스, 형식 및 범위와 같은 풍부한 메타데이터와 함께 Dataset Search 결과에 표시될 자격이 있습니다. 이 마크업이 없으면 데이터셋은 사실상 이 중요한 발견 채널에 보이지 않게 됩니다.

Dataset 스키마에 필수 필드는 무엇인가요?

Google은 Dataset 스키마에 최소한 이름과 설명을 요구합니다. 설명은 50~5000자 사이여야 하며, 데이터셋에 포함된 데이터, 수집 방법 및 활용 방안을 명확히 설명해야 합니다. 최상의 Dataset Search 가시성을 위해 강력히 권장되는 필드로는 제작자, 라이선스, datePublished, distribution(다운로드 URL 및 파일 형식 포함), 그리고 키워드가 있습니다.

Dataset 스키마에 어떤 라이선스를 지정해야 하나요?

license 속성에는 데이터셋이 배포되는 라이선스 전체 텍스트를 가리키는 URL을 포함해야 합니다. 일반적인 옵션으로는 CC BY 4.0(https://creativecommons.org/licenses/by/4.0/) 및 CC0(https://creativecommons.org/publicdomain/zero/1.0/)와 같은 Creative Commons 라이선스, 그리고 Open Data Commons 라이선스 등이 있습니다. Google Dataset Search는 라이선스를 눈에 띄게 표시하므로, 잘 알려진 오픈 라이선스를 선택하면 데이터셋이 더 접근하기 쉽고 잠재 사용자에게 매력적입니다.