DataON 연구데이터 관리·활용 가이드라인



- 연구데이터 인용과 활용지표 가이드라인 -doi http://doi.org/10.22711/7


    카테고리 가이드라인
    1.개요
      【 목 적 】
    • □ 연구데이터 활용 성과 인정을 위한 데이터 인용 방안 및 활용 실적 기준 마련
    • 【 대 상 】
    • □ 국가연구개발사업에서 연구데이터를 활용하고 있는 연구자
    • 【적용방법】
    • □ 타 연구자의 연구데이터 활용 시 논문, 특허, 보고서 등에 데이터 출처 표기
    • □ 연구데이터 활용 실적 측정을 위해 적절한 연구데이터 활용지표를 선정하여 적용
    2.연구데이터 인용
      【 정 의 】
    • □ 데이터 인용은 "학술적 크레딧을 부여하고 데이터에 대한 접근을 용이하게 하기기 위한 데이터에 대한 참조”로 정의됨(CODATA-ICSTI Task Group 2013)
    • 【 연구데이터 인용 원칙4)
      원칙 정의
      중요도
      (importance)
      데이터는 합법적이고 인용 가능한 연구 결과물임.
      데이터인용은 출판물과 동일한 중요도가 부여되어야 함.
      기여 인정과 기여자 표시
      (credit and attribution)
      데이터인용은 데이터의 모든 기여자에게 학술적인 인정과 규범적이고 법적인 기여자 표시를 제공해야 함.
      이와 함께 단일의 기여자 표시 방식이 모든 데이터에 적용 가능하지는 않다는 점도 인지해야 함.
      증거
      (evidence)
      학술 문헌이나 다른 어떤 경우에도 데이터가 사용될 때 상응한 데이터가 인용되어야 함.
      고유 식별
      (unique identification)
      데이터인용은 기계 작동이 가능하고, 세계적으로 고유하며, 커뮤니티에서 폭넓게 사용되는 지속적인 방식을 포함해야 함.
      접근
      (access)
      데이터인용은 데이터 자체에 대한 접근뿐만 아니라 관련된 메타데이터, 문서, 코드, 다른 자료 등이 해당 데이터에 대한 이용 정보로써 기계와 인간에 모두 이용 가능해야 함.
      지속성
      (persistence)
      고유 식별자와 데이터를 기술한 메타데이터와 배치는 지속적이어야 하고, 심지어 데이터의 수명보다 길어야 함.
      구체성과 검증가능성
      (specificity and verification)
      데이터인용은 구체적인 데이터의 식별, 접근, 검증가능성을 제공해야 함. 인용과 인용 메타데이터는 데이터의 특정 시분할, 버전, 세분된 영역을 검증하기에 충분할 정도로 출처와 무결성에 대한 정보를 제공해야 함.
      상호운용성과 유연성
      (interoperability and flexibility)
      데이터인용은 커뮤니티 간 상호운용성을 저해하지 않는 수준에서 여러 커뮤니티의 다양한 데이터 인용 방식을 충분히 포괄할 수 있을 정도로 유연해야 함.
      4) https://www.force11.org/datacitationprinciples
    3.데이터 인용 방법
      【 인용 방법 】
    • □ 연구에서 사용된 자신 또는 타인의 연구데이터는 아래와 같은 데이터 인용 포맷을 사용하여 논문 등 출판물의 참고문헌 섹션에서 인용할 것을 권장
    • Creator (Publication date): Title. Version. Location of publisher: Publisher. (Resource type). Identifier. Access date.

      ※ 데이터 인용 포맷은 해당 출판물의 인용 형식에 맞춰 변경될 수 있으며, Dryad, Figshare, Zenodo 등 많은 데이터 리포지터리에서는 데이터셋 랜딩 페이지에 데이터의 인용 형식이 표시되어 있음



    • □ 다음과 같이 데이터셋의 일부분만을 활용할 경우, 사용된 일부분의 데이터만을 정확히 인용하도록 해야 함
      • ◯ 특정 부분이나 하위 영역의 데이터셋을 인용
      • ◯ 특정 스냅샷을 인용
      • ◯ 지속적으로 업데이트되는 데이터셋을 인용할 때는 접근 일자와 시간을 포함
    • 【 인용 요소 】
      요소 정의 사용에시 및 제한사항
      Creator
      (생산자)
      데이터 생산에 관여한 주요 연구자
      (기여도 순)
      기관/단체 또는 개인의 이름일 수 있음
      Publication date
      (출판일)
      다음 중 최신의 날짜 : 데이터셋이 이용 가능하게 된 날짜, 품질 보증 절차가 완료된 날짜, 엠바고 기간이 만료된 날짜
      Title
      (제목)
      데이터셋의 명칭 또는 표제
      Version
      (버전)
      데이터셋의 버전.
      (버전은 데이터가 추가되거나 변경될 때 증가함)
      Resource type
      (자원 유형)
      데이터셋 유형에 대한 기술
      Publisher
      (출판자)
      데이터셋를 보관, 저장, 배포하는 리포지터리, 시스템, 조직 등의 이름 예: World Data Center for Climate (WDCC); GeoForschungsZentrum Potsdam (GFZ); Geological Institute, University of Tokyo, GitHub
      Identifier
      (식별자)
      통용되는 영구적 식별체계를 따르는
      데이터 식별자
      식별자는 자원을 식별할 수 있는 유일한 문자열임. 소프트웨어의 경우 식별자가 특정 버전을 지칭할 수도 있고, 전체 버전에 대한 것일 수도 있음.
      최근 많은 데이터 출판자들은 DOI를 활용하고 있음.
      Access Date
      (엑세스 날짜)
      해당 데이터셋에 접근한 최근 날짜
      Location of
      publisher
      (출판자의 위치)
      출판자의 위치 (예) 대전
    4.데이터 활용지표
      【 연구데이터의 영향력 평가 】
    • □ 데이터 영향력을 측정하는 데 있어서 가장 기본이 되는 것은 인용이나, 데이터 인용은 아직 활발하게 이루어지고 있지 못하므로, 데이터 리파지토리의 이용과 데이터가 실제로 공공의 사용의 정도 등 다양한 방식의 영향력 측정이 필요
    • □ 연구데이터는 분야별로 유형과 규모, 질적 가치, 활용방법 등이 매우 다양하여 정량적 지표만으로 상대 비교하기는 어려움
    • □ 데이터 활용지표는 생산된 데이터가 어떻게 활용되고 있는지를 보여줌으로써 데이터 생산자에게는 학술적 크레딧을 주어 데이터 공유를 증진시키고, 다른 연 구자들에게는 효율적인 데이터 검색·활용 도구로 사용될 수 있음
    • 【 데이터 활용 지표 (안) 】
    • □ 연구 분야에 따라 데이터 재사용에 대한 요구가 다르며, 해당 학문의 문화와 관 행의 영향을 받음. 따라서 연구 분야에 따라 데이터 영향력 측정 도구 개발이 반영되어야 함
    • □ 연구데이터 활용도 측정에 사용할 수 있는 지표는 다음과 같으며, 이 중 적합한 지표는 선별조합하여 사용할 수 있음
    • <연구데이터 활용 지표>
      지표 데이터셋 적용 시 기관 또는 데이터 저널 적용 시
      인용지표 (소스: Web of Science, Scopus, Google Scholar)
      A. 생산성 N/A 데이터 기관이나 저널을 기준으로 데이터셋의 총 생산 개수
      B. 피인용 특성
      B-1. 피인용 횟수 각 데이터셋의 피인용 횟수. 피인용 횟수는 WoS, Scopus, Google Scholar 등의 소스를 이용할 수 있음 데이터기관에서 생산한, 또는 데이터 저널에서 출판한 데이터셋들의 총 피인용 횟수. 피인용 횟수는 WoS, Scopus, Google Scholar 등의 소스를 이용할 수 있음
      B-2. 피인용 평균 종단연구/횡단연구 데이터셋의 경우, 연도별 피인용 평균을 비교함으로써, 개별 데이터셋 중 인용이 많이 된 데이터셋 파악이 가능 데이터기관에서 생산한, 또는 데이터저널에서 출판한 데이터셋들의 평균 피인용 횟수
      B-3. 영향력 있는 학술지로부터의 피인용비율 SCI(SSCI) 게재 논문, KCI 논문 등의 기준을 정하여 영향력 있는 학술지로부터의 피인용 비율을 볼 수 있음 SCI(SSCI) 게재 논문, KCI 논문 등의 기준을 정하여 영향력 있는 학술지로부터의 피인용 비율을 볼 수 있음
      C. 학제성 인용비율을 수정하여, 핵심 전체논문 수와 주제분야에 출 판된 논문 수를 비교

      R=1-(i/N)
      N: 전체 논문수
      i: 핵심주제분야의 논문 수

      해당 저널에 수록된 데이터셋, 특정기관에서 생산한 데이터셋의 학제성을 전체적으로 분석
      D. 시기적 특성
      D-1. 즉시성 데이터셋이 출판된 후, 빨리 인용되는 정도로 데이터 출판 당해년도 피인용 숫자로 측정 해당 저널에 수록된 데이터셋, 특정기관에서 생산한 데이터셋이 빨리 인용되는 정도로, 당해 연도 총 생산된 데이터셋 중 당해연도 논문에 인용된 비율을 계산
      D-2. 경과시간
      (elapsed time)
      데이터셋이 출판된 시기를 기준으로, 연도별로 출판된 논문의 숫자 해당 저널에 수록된 데이터셋, 특정기관에서 생산한 데이터셋의 경과시간을 평균내어 계산
      Altmetrics (소스; altmetrics aggregators, 데이터 리파지토리 등에서 제공하는 usage indicators 등. 각 주제분야에 따라 적절한 소스 선별 필요)
      A. 학술적 영향력 Online reference managers(Mendeley, CiteULike) Academicsocial network site (Academia.edu, Researchgate) Post publication peer review forums (PubPeer, Publons) Reviews on F1000 Repository-based indicators 데이터셋에 적용가능한 지표를 기관과 데이터저널에 확장 적용
      B. 사회적 영향력 일반 웹사이트의 인용 또는 링크
      특정 웹사이트 ((onlinepresentations, science blogs)의 인용 또는 링크, 실라버스에서의 인용
      wikipedia에서의 인용
      정책자료에서의 인용
      소셜미디어 (Twitter, Facebook, Google+, Reddit, YouTube)
      Mainstream media
      특허에서의 인용
      데이터셋에 적용가능한 지표를 기관과 데이터저널에 확장 적용
      Secondary Impact (위의 인용지표, altmetrics 소스 참조)
      피인용 횟수 데이터셋을 인용한 연계출판물(affiliated publications)의 총 피인용 횟수. 피인용 횟수는 WoS, Scopus, Google Scholar등의 소스 이용
      피인용 평균 연계출판물 당 피인용 평균 데이터기관에서 생산한, 또는 데이터 저널에서 출판한 데이터셋들을 인용 한 연계 출판물(affiliated publications)당 피인용 평균
      Altmetrics에 나타난 학술적 영향력 Online reference managers(Mendeley, CiteULike) Academicsocial network site (Academia.edu, Researchgate) Post publication peer review forums (PubPeer, Publons) Reviews on F1000 Repository-based indicators 데이터셋에 적용가능한 지표를 기관과 데이터저널에 확장 적용
      Altmetrics에 나타난 사회적 영향력 일반 웹사이트의 인용 또는 링크 특정 웹사이트 ((online presentations, science blogs) 의 인용 또는 링크,
      실라버스에서의 인용
      wikipedia에서의 인용
      정책자료에서의 인용
      소셜미디어 (Twitter, Facebook, Google+, Reddit, YouTube)
      Mainstream media
      특허에서의 인용
      데이터셋에 적용가능한 지표를 기관과 데이터저널에 확장 적용