이 표준은 국내 데이터 포털에서 제공하는 데이터세트를 의미적으로 표현하는 DCAT 응용 프로파일을 RDF 어휘로 정의한다. 이 표준은 데이터 카탈로그와 데이터세트를 기술하기 위한 메타데이터를 필수요소, 권장요소와 선택요소로 구체화한다. 이 표준은 서로 다른 데이터 포털에서 사용되고 있는 메타데이터 요소를 공통항목으로 표현하여 데이터세트의 상호운용을 지원하는 방안을 제공한다. 한편 이 표준을 적용한 데이터 포털은 데이터세트를 의미적 수준에서 검색할 수 있는 기능을 제공할 수 있다.
This standard defines the RDF vocabulary of DCAT application profiles for interoperability of datasets published on domestic data portals. We present a method that can be applied to domestic data portals by specifying essential, recommended, and optional elements for metadata technology of data catalogs and datasets. Through this, metadata used in domestic data portals can be described consistently and becomes the basis for systematic metadata management. In addition, datasets provided by heterogeneous data portals can be explored integrally, ultimately increasing the reuse of datasets.
Introduction
대한민국의 데이터 포털을 위한 DCAT 응용 프로파일 (이하 DCAT-AP-KR)은 데이터 포털에서 제공하는 데이터세트를 기술하기 위한 메타데이터 명세(metadata specification)이고, 대한민국의 공공·민간 기관이 운영 또는 관리하는 데이터 포털을 대상으로 한다. DCAT-AP-KR은 유럽 연합의 데이터 포털에 적용한 DCAT-AP를 국내 데이터 포털에 적용하기 위해 확장한 표준이다.
모델링 원칙
DCAT-AP-KR은 DCAT-AP 버전 2.1.0을 기반으로, 반드시 필요한 최소의 어휘만 신규로 정의한다. 구체적인 모델링 원칙은 다음과 같다.
DCAT-AP-KR은 기존 RDF 어휘의 재사용을 원칙으로 한다. 특히, 웹 자원을 기술하기 위한 어휘인 더블린코어 이니셔티브 메타데이터 어휘 (DCMI Metadata Terms)를 광범위하게 재사용한다. 예를 들어, 데이터세트의 제목, 개방일과 수정일은 dct:title, dct:issued와 dct:modified로 표현한다.
DCAT-AP-KR은 DCAT-AP 모델링 원칙을 따라 필수 속성(mandatory property), 권장 속성(recommended property), 선택 속성(optional property)을 정의한다. 필수 속성은 데이터세트를 기술하기 위해 반드시 해당 속성이 사용되어야 하고, 권장 속성은 해당 속성에 대한 정보가 제공되면 사용을 권고하는 속성이다. 선택 속성은 해당 속성을 반드시 사용할 필요는 없지만, 추가적인 정보를 제공하는 측면에서 고려할 수 있는 속성이다.
DCAT-AP-KR의 온톨로지 모델
DCAT-AP-KR의 핵심 클래스는 DCAT과 동일하다. 데이터 카탈로그(dcat:Catalog) 클래스는 데이터세트 또는 데이터 서비스의 집합이다. 이 클래스는 데이터세트(dcat:Dataset) 클래스와 데이터 서비스(dcat:DataService) 클래스를 각각 dcat:dataset와 dcat:service 속성으로 연결한다. 데이터세트(dcat:Dataset)는 다양한 형식으로 접근하거나 다운로드 받을 수 있는 데이터의 집합이다. 데이터세트는 하나 이상의 배포 형식(dcat:Distribution)으로 표현된다. 데이터세트의 특정한 배포 형식(dcat:Distribution)은 물리적인 데이터세트를 의미하며, CSV, XLSX와 같이 특정한 파일 형태로 다운로드 받을 수 있다. 데이터세트의 배포 형식은 API와 같은 데이터 서비스(dcat:DataService) 형태로 표현된다.
Namespace
DCAT-AP-KR의 네임스페이스는 ‘http://vocab.datahub.kr/def/dcat-ap-kr/’이다. DCAT-AP-KR은 기존 어휘의 재사용을 원칙으로 하고, 최소한의 어휘만 정의한다. 자원에 대한 일반적인 기술은 RDF, RDFS, DCT를 사용한다. 데이터 카탈로그와 데이터세트에 대한 기술은 DCAT을 광범위하게 재사용한다. DCAT-AP-KR에서 사용한 외부 어휘의 접두사(prefix)와 네임스페이스(namespace)는 아래와 같다.
접두사(prefix)
Namespace IRI
Source
dcat
http://www.w3.org/ns/dcat#
[[VOCAB-DCAT]]
dct
http://purl.org/dc/terms/
[[DCTERMS]]
rdf
http://www.w3.org/1999/02/22-rdf-syntax-ns#
[[RDF-SYNTAX-GRAMMAR]]
rdfs
http://www.w3.org/2000/01/rdf-schema#
[[RDF-SCHEMA]]
owl
http://www.w3.org/2002/07/owl#
[[OWL2-SYNTAX]]
skos
http://www.w3.org/2004/02/skos/core#
[[SKOS-REFERENCE]]
xsd
http://www.w3.org/2001/XMLSchema#
[[XMLSCHEMA11-2]]
schema
http://schema.org
[[SCHEMA-ORG]]
foaf
http://xmlns.com/foaf/0.1/
[[FOAF]]
vcard
http://www.w3.org/2006/vcard/ns#
[[VCARD-RDF]]
koor
http://vocab.datahub.kr/def/organization/
Terminology
응용 프로파일(Application Profile) : 하나 이상의 표준 용어를 재사용하는 명세(specification). 특정 프로파일에서 사용하는 필수요소, 권장요소, 선택요소와 함께 통제 어휘에 대한 권장사항 정의
데이터세트(Dataset) : 데이터의 집합. 테이블 형식의 데이터는 하나 이상의 행과 열을 포함하고 있음
데이터 포털(Data Portal) : 데이터 카탈로그와 데이터세트를 검색하고 재사용할 수 있는 서비스를 제공하는 웹 기반 시스템
필수 속성(Mandatory property) : 응용 프로파일에서 의무적으로 기술하는 메타데이터 속성
권장 속성(Recommended property) : 응용 프로파일에서 메타데이터를 기술하기 위해 권장하는 속성
선택 속성(Optional property) : 응용 프로파일에서 메타데이터를 기술하기 위해 선택적으로 적용하는 속성
메타데이터(Metadata) : 데이터에 대한 데이터. 다른 데이터를 기술하기 위해 사용되는 데이터
Vocabulary specification
DCAT-AP-KR은 DCAT-AP에 정의되지 않은 속성을 추가하고, 국내 데이터 포털의 메타데이터에 맞는 통제 어휘를 정의한다.
Class: Catalog
Property: title
Property:
`dct:title`
Label:
제목
Priority:
Mandatory
Description:
카탈로그명을 표현. 2가지 이상의 언어로 제공되는 경우, 언어 태그를 붙여 표현
Range:
`rdfs:Literal`
Property: publisher
Property:
`dct:publisher`
Label:
제공기관
Priority:
Mandatory
Description:
카탈로그를 공개, 개방, 게재하는 기관 또는 부서를 표현함
Range:
`koor:Organization`
Property: description
Property:
`dct:description`
Label:
설명
Priority:
Mandatory
Description:
카탈로그에 대한 설명. 2가지 이상의 언어로 제공되는 경우, 언어 태그를 붙여 표현
Range:
`rdfs:Literal`
Property: dataset
Property:
`dcat:dataset`
Label:
데이터세트
Priority:
Recommended
Description:
카탈로그와 카탈로그에 포함된 데이터세트를 연결한다. 카탈로그에 데이터세트가 포함되지 않은 경우, dcat:service로 빈 카탈로그와 연결해주어야 한다.
Range:
`dcat:Dataset`
Property: service
Property:
`dcat:service`
Label:
서비스
Priority:
Recommended
Description:
카탈로그에 포함된 사이트나 엔드포인트를 표현할 수 있다. 서비스로 연결되지 않는 빈 카탈로그는 dcat:dataset으로 연결되어야 한다.
Range:
`dcat:DataService`
Property: homepage
Property:
`foaf:homepage`
Label:
홈페이지
Priority:
Recommended
Description:
카탈로그에 대한 메인 웹 페이지를 표현한다.
Range:
`foaf:Document`
Property: language
Property:
`dct:language`
Label:
언어
Priority:
Recommended
Description:
제목과 설명 등의 메타데이터를 기술한 언어를 표현한다. 해당 속성값은 통제 어휘 언어를 참조한다.
Range:
`dct:LinguisticSystem`
Property: license
Property:
`dct:license`
Label:
라이선스
Priority:
Recommended
Description:
카탈로그가 사용하거나 재사용할 수 있는 라이선스를 표현한다. 해당 속성은 통제 어휘 라이선스를 참조한다.
Range:
`dct:LicenseDocument`
Property: themeTaxonomy
Property:
`dcat:themeTaxonomy`
Label:
테마/카테고리
Priority:
Recommended
Description:
데이터세트를 분류하는데 사용되는 지식 조직 체계를 표현한다. 해당 속성값은 통제 어휘 6.7.3 카테고리 체계를 참조한다.
Range:
`skos:ConceptScheme`
Property: maintainer
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:maintainer`
Label:
관리기관
Priority:
Optional
Description:
카탈로그가 웹에서 게시될 수 있도록 관리하는 플랫폼 또는 데이터 서비스 관리기관 또는 부서를 표현한다.
Range:
`koor:Organization`
Property: numberOfView
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:numberOfView`
Label:
조회 수
Priority:
Optional
Description:
카탈로그의 조회 수를 표현한다.
Range:
`xsd:nonNegativeInteger`
Class: Dataset
Property: title
Property:
`dct:title`
Label:
제목
Priority:
Mandatory
Description:
이 속성은 데이터세트명을 표현한다. 2가지 이상의 언어로 제공되는 경우, 언어 태그를 붙여 표현한다.
Range:
`rdfs:Literal`
Property: description
Property:
`dct:description`
Label:
설명
Priority:
Mandatory
Description:
데이터세트에 대한 설명을 표현한다. 2가지 이상의 언어로 제공되는 경우, 언어 태그를 붙여 표현한다.
Range:
`rdfs:Literal`
Property: distribution
Property:
`dcat:distribution`
Label:
배포
Priority:
Recommended
Description:
데이터세트의 이용가능한 배포와 연결하는 속성이다.
Range:
`dcat:Distribution`
Property: publisher
이 속성은 DCAT-AP-KR에서 수정된 속성입니다.
Property:
`dct:publisher`
Label:
제공기관
Priority:
Recommended
Description:
데이터세트를 공개, 개방, 게재하는 기관을 표현한다.
Range:
`koor:Organization`
Property: theme
Property:
`dcat:theme`
Label:
주제/카테고리
Priority:
Recommended
Description:
데이터세트의 카테고리를 표현한다. 하나의 데이터세트는 여러 개의 주제와 관련될 수 있다. 해당 속성값은 통제 어휘 카테고리를 참조한다.
Range:
`skos:Concept`
Property: maintainer
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:maintainer`
Label:
관리기관
Priority:
Recommended
Description:
카탈로그가 웹에서 게시될 수 있도록 관리하는 플랫폼 또는 데이터 서비스 관리기관 또는 부서를 표현한다.
Range:
`koor:Organization`
Property: accrualPeriodicity
Property:
`dct:accrualPeriodicity`
Label:
업데이트 주기
Priority:
Optional
Description:
데이터세트가 업데이트 되는 주기를 표현한다. 해당 클래스는 통제 어휘 업데이트 주기를 참조한다.
Range:
`dct:Frequency`
Property: creator
이 속성은 DCAT-AP-KR에서 수정된 속성입니다.
Property:
`dct:creator`
Label:
생산기관
Priority:
Optional
Description:
데이터세트를 생산하는데 책임이 있는 기관을 표현한다.
Range:
`koor:Organization`
Property: identifier
Property:
`dct:identifier`
Label:
식별자
Priority:
Optional
Description:
데이터세트의 식별자를 표현한다. 예를 들어, 데이터세트의 URI나 카탈로그 맥락에서 사용되는 유일한 식별자를 기술할 수 있다.
Range:
`rdfs:Literal`
Property: language
Property:
`dct:language`
Label:
언어
Priority:
Optional
Description:
제목과 설명 등의 메타데이터를 기술한 언어를 표현한다. 해당 속성값은 통제 어휘 언어를 참조한다.
Range:
`dct:LinguisticSystem`
Property: provenance
Property:
`dct:provenance`
Label:
출처정보
Priority:
Optional
Description:
데이터세트의 계보(lineage)에 대한 정보를 포함한다.
Range:
`dct:ProvenanceStatement`
Property: relation
Property:
`dct:relation`
Label:
관련 자원
Priority:
Optional
Description:
관련 자원을 표현한다.
Range:
`rdfs:Resource`
Property: issued
Property:
`dct:issued`
Label:
등록일
Priority:
Optional
Description:
데이터세트의 공식적으로 게시된 날짜를 표현한다. 날짜 형식은 YYYY-MM-DD의 형식을 따르는 것이 권장된다.
Range:
`xsd:date`
Property: modified
Property:
`dct:modified`
Label:
수정일
Priority:
Optional
Description:
데이터세트가 마지막으로 수정된 날짜를 표현한다. 날짜 형식은 YYYY-MM-DD의 형식을 따르는 것이 권장된다.
Range:
`xsd:date`
Property: type
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dct:type`
Label:
데이터 서비스 유형
Priority:
Optional
Description:
데이터세트가 제공되는 서비스 유형을 표현한다. 해당 속성은 통제 어휘 데이터 서비스 유형을 참조한다.
Range:
`skos:Concept`
Property: legalBasis
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:legalBasis`
Label:
보유근거
Priority:
Optional
Description:
데이터세트에 대한 보유 근거를 표현한다. 관련 법령이나 기업 내규 등을 작성할 수 있다.
Range:
`rdfs:Literal`
Property: numberOfView
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:numberOfView`
Label:
조회 수
Priority:
Optional
Description:
데이터세트의 조회 수를 표현한다.
Range:
`xsd:nonNegativeInteger`
Property: fee
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:fee`
Label:
데이터 비용 부과 유무
Priority:
Optional
Description:
데이터세트가 비용이 부과되는 유무를 표현한다. 데이터세트의 비용이 부과되면 true로, 무료이면 false로 표현한다.
Range:
`xsd:boolean`
Property: offer
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`schema:offer`
Label:
데이터 비용 정보
Priority:
Optional
Description:
데이터세트의 비용이 부과되면, 가격와 관련 정보는 해당 속성으로 표현한다.
Range:
`schema:Offer`
Property: numberOfRow
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:numberOfRow`
Label:
데이터 비용 정보
Priority:
Optional
Description:
데이터세트의 행 개수를 표현한다.
Range:
`xsd:nonNegativeInteger`
Property: derivedSystem
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:derivedSystem`
Label:
원시시스템
Priority:
Optional
Description:
데이터세트가 추출된 원시 시스템 정보를 표현한다.
Range:
`rdfs:Resource`
Property: nextRegistrationDate
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:nextRegistrationDate`
Label:
차기 등록 예정일
Priority:
Optional
Description:
데이터세트가 업데이트될 예정 일자를 표현한다.
Range:
`xsd:date`
Class: Distribution
Property: accessURL
이 속성은 DCAT-AP-KR에서 수정된 속성입니다.
Property:
`dcat:accessURL`
Label:
접근 URL
Priority:
Optional
Description:
데이터세트의 배포에 접근할 수 있는 URL을 표현한다. 접근 URL의 자원은 데이터세트를 얻을 수 있는 정보를 포함할 수 있다.
Range:
`xsd:anyURI`
Property: accessURL
이 속성은 DCAT-AP-KR에서 수정된 속성입니다.
Property:
`dcat:accessURL`
Label:
접근 URL
Priority:
Mandatory
Description:
데이터세트의 배포에 접근할 수 있는 URL을 표현한다. 접근 URL의 자원은 데이터세트를 얻을 수 있는 정보를 포함할 수 있다.
Range:
`xsd:anyURI`
Property: availability
Property:
`dcatap:availability`
Label:
이용 가능성
Priority:
Mandatory
Description:
데이터세트의 배포에 대한 기한을 표현한다. 데이터세트의 접근이나 다운로드가 가능한 기한을 표현할 수 있다. 해당 속성은 통제 어휘 이용 가능성을 참조한다.
Range:
`skos:Concept`
Property: description
Property:
`dct:description`
Label:
설명
Priority:
Recommended
Description:
데이터세트의 배포에 대한 설명을 표현한다. 2가지 이상의 언어로 제공되는 경우, 언어 태그를 붙여 표현한다.
Range:
`rdfs:Literal`
Property: format
Property:
`dct:format`
Label:
형식
Priority:
Recommended
Description:
배포 시 파일 형식을 표현한다. 해당 속성값은 통제 어휘 매체 유형을 참조한다.
Range:
`dct:MediaType`
Property: license
Property:
`dct:license`
Label:
라이선스
Priority:
Recommended
Description:
데이터세트를 사용하거나 재사용할 수 있는 라이선스를 표현한다. 해당 속성은 통제 어휘 라이선스를 참조한다.
Range:
`dct:LicenseDocument`
Property: accessService
Property:
`dcat:accessService`
Label:
서비스 접근
Priority:
Optional
Description:
데이터세트의 배포에 접근할 수 있는 데이터 서비스를 표현한다.
Range:
`dcat:DataService`
Property: downloadURL
이 속성은 DCAT-AP-KR에서 수정된 속성입니다.
Property:
`dcat:downloadURL`
Label:
다운로드 URL
Priority:
Optional
Description:
주어진 형식으로 바로 다운로드 가능한 URL을 표현한다.
Range:
`xsd:anyURI`
Property: issued
Property:
`dct:issued`
Label:
등록일
Priority:
Optional
Description:
배포가 시작된 공식적인 날짜를 표현한다.
Range:
`xsd:date`
Property: modified
Property:
`dct:modified`
Label:
수정일
Priority:
Optional
Description:
데이터세트의 배포 버전이 마지막으로 수정된 날짜를 표현한다. 날짜 형식은 YYYY-MM-DD의 형식을 따르는 것이 권장된다.
Range:
`xsd:date`
Property: title
Property:
`dct:title`
Label:
제목
Priority:
Optional
Description:
배포에 대한 제목을 표현한다. 2가지 이상의 언어로 제공되는 경우, 언어 태그를 붙여 표현한다.
Range:
`rdfs:Literal`
Property: numberOfDownload
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:numberOfDownload`
Label:
다운로드 횟수
Priority:
Optional
Description:
데이터 세트의 배포가 다운로드된 횟수를 표현한다.
Range:
`xsd:nonNegativeInteger`
Property: numberOfRow
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcat:numberOfDownload`
Label:
다운로드 횟수
Priority:
Optional
Description:
데이터세트의 행 개수를 표현한다.
Range:
`xsd:nonNegativeInteger`
Class: DataService
Property: title
Property:
`dct:title`
Label:
제목
Priority:
Mandatory
Description:
이 속성은 데이터 서비스명을 표현한다. 2가지 이상의 언어로 제공되는 경우, 언어 태그를 붙여 표현한다.
Range:
`rdfs:Literal`
Property: endpointURL
이 속성은 DCAT-AP-KR에서 수정된 속성입니다.
Property:
`dcat:endpointURL`
Label:
엔드포인트 URL
Priority:
Mandatory
Description:
데이터 서비스의 루트 경로(root location) 또는 엔드포인트(IRI)를 표현한다. 예를 들어, 오픈API 서비스는 데이터에 접근할 수 있는 URL 경로를 작성한다.
Range:
`dcat:endpointURL`
Property: endpointDescription
Property:
`dcat:endpointDescription`
Label:
엔드포인트 설명
Priority:
Recommended
Description:
엔드포인트로 이용할 수 있는 서비스의 설명을 제공한다. 실제 엔드포인트 인스턴스에 대한 상세한 기술을 제공할 수 있다. 엔드포인트를 이용하는 방법에 대한 기술문서도 해당 속성으로 표현할 수 있다.
Range:
`rdfs:Resource`
Property: servesDataset
Property:
`dcat:servesDataset`
Label:
데이터세트 서비스
Priority:
Recommended
Description:
해당 서비스를 배포하는 데이터세트를 표현한다.
Range:
`dcat:Dataset`
Property: description
Property:
`dct:description`
Label:
데이터 서비스의 설명
Priority:
Optional
Description:
데이터 서비스에 대한 설명을 표현한다. 2가지 이상의 언어로 제공되는 경우, 언어 태그를 붙여 표현한다.
Range:
`rdfs:Literal`
Property: license
Property:
`dct:license`
Label:
라이선스
Priority:
Optional
Description:
데이터 서비스의 이용조건에 대한 라이선스를 표현한다. 해당 속성은 통제 어휘 라이선스를 참조한다.
Range:
`dct:LicenseDocument`
Property: type
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dct:type`
Label:
API 유형
Priority:
Optional
Description:
데이터 서비스에서 사용하는 아키텍처 스타일을 표현한다. API 유형으로 REST 또는 RPC가 해당될 수 있다. 해당 속성은 통제 어휘 API 유형을 참조한다.
Range:
`rdfs:Resource`
Property: numberOfRequest
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:numberOfRequest`
Label:
활용신청 횟수
Priority:
Optional
Description:
API의 활용을 신청한 횟수를 표현한다.
Range:
`xsd:numberOfInteger`
Property: numberOfRequestLimit
이 속성은 DCAT-AP-KR에서 새롭게 추가된 속성입니다.
Property:
`dcatkr:numberOfRequestLimit`
Label:
요청제한 횟수
Priority:
Optional
Description:
API의 요청제한 횟수를 표현한다.
Range:
`xsd:numberOfInteger`
Controlled Vocabulary
통제 어휘의 사용이 명시된 속성은 공역으로 통제 어휘의 값을 사용해야 한다.
Media Type
매체 유형의 통제 어휘는 MIME(Multipurpose Internet Mail Extensions) 유형을 사용한다. 추가적인 매체 유형은 IANA 매체 유형의 목록을 참조한다.
이 통제 어휘는 DCAT-AP-KR에서 항목과 값이 변경되었습니다.
항목
값
HWP (.hwp)
application/vnd.hancom.hwp
마이크로소프트 워드 (.docx)
application/msword
CSV (.csv)
text/csv
HTML (.html)
text/html
JSON (.json)
application/json
마이크로소프트 엑셀 (.xls)
application/vnd.ms-excel
PDF (.pdf)
application/pdf
Turtle로 표현된 RDF (.ttl)
text/turtle
RDF/XML (.rdf)
application/rdf+xml
텍스트 (.txt)
text/plain
Language
언어는 ISO 639-1의 언어 표기 체계를 따라 2자리수로 표현한다. 추가적인 언어 코드는 ISO 639-1의 언어 표기 체계를 참조한다.
라이선스는 DCAT-AP-KR에서 정의한 라이선스 통제 어휘를 사용한다. 라이선스 통제 어휘는 크리에이티브 커먼스(Creative Commons)와 공공누리를 포함한다. 추가적인 라이선스는 EU 어휘의 라이선스(EU Vocabularies Licence) 통제 어휘를 참고할 수 있다.