DataON 연구데이터 관리·활용 가이드라인



- 데이터관리계획(DMP) 가이드라인 -doi http://doi.org/10.22711/4


    카테고리 가이드라인
    1.개요
      【 목 적 】
    • □ 국가연구개발사업에서 생산되는 연구데이터에 대한 데이터관리계획(Data Management Plan, DMP)의 작성 및 점검 기준 마련
    • 【 대 상 】
    • □ 국가연구개발사업 중 연구데이터를 생산하는 과제
    • 【 적용방법 】
    • □ 국가연구개발사업 제안 시 연구과제계획서와 함께 데이터관리계획 제출을 의무 화하고, 연구과제 선정 및 최종 평가 시 계획과 이행여부를 검토
    • □ 공통 적용을 원칙으로 하되 항목별로 출연 연( ) 실정에 맞게 수정 적용
    • 【 준 용 】
    • □ 본 가이드라인에서 정하지 아니한 사항은 각 출연연 의 제규정 준용 가능
    • 【 시 행 】
    • □ 본 가이드라인에서 정하지 아니한 사항은 각 출연연 의 제규정 준용 가능
    • 【 시행시점 】
    • □ 본 가이드라인은 각 출연연 이 제정한 날부터 시행
    2. 데이터 관리 계획
      【 개 요 】
    • □ 미국, 영국 등 주요 선진국은 공공자금이 투입한 연구 성과물 (논문 , 보고서, 데 이터 등) 을 공유·활용 촉진 정책 추진
      • ◯ 특히, 연구 성과물 중 연구데이터의 쉬운 접근과 재사용을 촉진하기 위해 데 이터관리계획 제출 의무화 추진
      • ◯ 과기정통부에서는 2019년 시범 R&D과제를 대상으로 데이터관리계획 제출 의 무화를 우선 시행하며, 2020년부터 적용대상을 단계적으로 확대 예정
    • 【 구 성 】
    • □ 데이터관리계획은 R&D 과정에서 생산되는 연구데이터의 유형, 관리, 공유계획 내용이 포함

    • 【기대 효과 】
    • □ R&D 과제를 통한 연구데이터 생성, 관리, 공유 현황 파악 가능
      • ◯ 현행 제도로는 R&D 과제에서 발생되는 연구데이터의 생산, 관리, 현황 파악 불가하나, 데이터관리계획을 통한 연구데이터 현황 파악 가능
      • ◯ 특히, 연구데이터 재현성과 재사용으로 연구의 진실성을 확보하고 중복 연구 를 피함으로써 연구자의 연구 효율성을 제고할 수 있음
    3. 연구프로세스 상의 데이터관리계획 적용
      【 과제 기획 및 선정 단계 】
    • □ 기존 과제 선정 과정에서 데이터관리계획 작성·검토 단계 추가
    • □ 연구자에게 데이터관리계획 작성 지침 및 도구 제공으로 편의성 제공
    • □ 과제 선정 평가 시 데이터관리계획 추가 심의

    • 【 과제 평가 단계 】
    • □ 기존 평가 과정에서 데이터관리계획 이행여부 점검 단계 추가
    • □ 과제 결과 평가 시 데이터관리계획 이행여부 점검 추가 심의
    • □ 데이터관리계획 이행여부 점검 결과 미흡인 경우 페널티 또는 추가조치

    4. 데이터관리계획 작성
      【 작성 절차 】
    • □ 연구과제 기획 및 선정 단계에서 데이터관리계획 작성 및 제출
    • □ 데이터관리계획이 변경될 경우 과제 종료 또는 년차 변경 시 데이터관리계획을 갱신
    • 【 작성 양식 】
    • □ 연구과제계획서 제출 시 페이지 내외의 데이터관리계획이 포함되어야 함
    • □ 연구데이터가 생성되지 않는 경우에는 ""데이터가 생산되지 없음”을 표기
    • □ 데이터관리계획에는 다음과 같이 구성되며 연구기관별로 필요한 요소를 추가하여 활용
    • 연구과제명 연구과제명 기재
      (1) 연구데이터 개요
      수집·생산 데이터 및 유형

      - 수집 데이터에 대한 간략한 설명(기존 데이터 혹은 타 데이터 소스 사용 등을 포함)

      - 데이터 유형 및 크기(규모)에 대한 설명

      - 데이터 파일의 포맷(예: Text file (SCV, TXT), Microsoft Excel, Database File (DBF, mdb 등), PDF, JPG, Hierachical Data Format(HDF), eXtensible Markup Language(XML), 등)

      ※ 연구데이터는 예비분석결과, 논문이나 저술의 초안, 연구노트, 보고서 등은 해당되지 않음

      데이터 수집·생산 방법

      - 어떤 방법 혹은 표준을 통해 데이터가 수집·생산될 것인지 설명

      - 데이터 입수에 사용될 구체적인 방법(예: 관측 기구 혹은 실험 장비의 사용, 컴퓨터 시뮬레이션, 설문지, 인터뷰, 관찰 등)에 대해 기재

      (2) 연구데이터의 저장 및 장기적인 보존 계획
      연구 수행 중 데이터 저장·백업

      - 연구 수행 중 데이터를 어디에 저장, 관리할 것인지 설명

      - 데이터의 백업은 구체적으로 어떤 방법을 통해, 어떤 주기로 시행될 것인지? 문제가 생겼을 때 데이터 복원 방법은 무엇인지 등 기재

      연구 종료 후 데이터 보존

      - 연구 종료 후 장기적으로 어떤 장치 혹은 기관에 기탁함으로써 보존할 것인지 기재

      - 연구 분야 또는 연구기관의 데이터 리포지토리가 존재하는지 기재하고 활용 여부 설명

      ※ 연구자의 개인 컴퓨터, 연구실 서버 등은 장기적인 보존의 방법으로는 적합하지 않으며 전문적인 데이터센터, 데이터 리포지토리를 활용하거나 소속 연구기관이 제공하는 보다 안정적인 저장 장소 혹은 서비스가 바람직

      (3) 연구데이터의 공유 계획
      데이터 공유 방법

      - 연구 종료 후 데이터를 언제, 어떤 방법으로 어디에, 어느 범위에서 공유할 것인지 기재

      - 데이터의 공유 시점 기재 (통상 학술지에 논문을 게재하는 경우 출판 시점에서 적어도 6개월 이내가 바람직하며, 연구 종료 후 2년 내에 공개하는 것이 권장됨)

      - 데이터의 식별, 인용을 하는데 필요한 식별자(예: DOI, Digital Object Identifier)의 입수 및 부착 여부 기재

      - 데이터 파일 이외에도 실제로 데이터를 이해하기 위해 필요한 도큐멘테이션이 있다면 기재(예를 들어 설문조사의 경우 설문지, 코드북, 데이터 파일이 함께 공유되어야 하고 파일 내의 변수, 수치들을 이용자가 파악할 수 있도록 하는 readme 파일을 포함한 각종 기술(technical) 및 보조 문서, 혹은 메타데이터 파일이 함께 제공되어야 함. 학술지 논물 혹은 보고서는 해당되지 않음)

      ※ 공유를 하는 구체적인 방식에 대해 기재하되 발표하는 학술지에서 요구하는 데이터 기탁 서비스, 해당 분야의 데이터 리포지토리, 소속 연구기관의 공개 사이트 등의 활용이 바람직함

      공유·공개 제한

      - 데이터를 공개하거나 공유하는데 제한이 되는 상황 (인적사항이 포함된 개인정보, 기밀 유지 필요, 지적재산권 및 잠재적인 상업적 가치 보호 등), 데이터의 사용에 대한 제한 여부 (라이선싱 조건, 엠바고 및 공유 제한 사항)이 있는지 또 이런 제한을 어떻게 해결·충족시킬지 기재

      (4) 데이터 관리 및 공유 책임자
      책임자 이름

      - 연구책임자 혹은 연구 참여자 중에 데이터의 전반적인 관리, 저장 및 공유에 대한 세부적인 사항을 점검하고 의무 사항을 이행할 연구자의 이름 및 연락처(주소 혹은 이메일)

      - 복수의 책임자 기재 가능


      【계획 변경 】
    • □ 연구과제 수행 중에 데이터관리계획이 변경될 경우는 연구과제 종료 시점인 최 종보고서 작성 시에 데이터관리계획에 대한 갱신 및 이행에 관한 사항을 포함하 여 보고해야 함
    • □ 다년도 계속사업 경우 초기 데이터관리계획에 반영하지 못한 연구데이터 관련 실적을 연차실적·계획서에 포함해서 작성 및 보고
    5. 데이터관리계획 점검
      【 점검 절차 】
    • □ 연구과제의 선정 시 제출된 데이터관리계획을 검토
    • □ 과제 종료 또는 년차 변경 시 데이터관리계획의 이행 여부 검토
    • 【 DMP 검토 】
    • □ 연구과제의 선정 평가 시 해당 분야의 전문가 이외에 별도의 데이터 전문가의 참여하여 데이터관리계획을 검토하거나 관련 전담부서에서 사전에 검토
    • □ 데이터관리계획의 전반적인 심사 원칙은 아래와 같음
      • ◯ 계획은 명료하고 구체적이며, 현실적이어야 함
      • ◯ 해당 연구분야 혹은 연구문제에 대한 표준적인 혹은 모범적인 관행을 따라야 함
      • ◯ 계획은 가능한 범위에서 데이터 공유를 적극적으로 지향해야 함
    • □ 데이터관리계획 체크리스트 및 심사의견서
      • ◯ 다음의 체크리스트를 기준으로 데이터관리계획을 검토하도록 하며, 연구기관 에 따라 필요한 검토항목을 추가하여 활용함

      <데이터 관리 계획 체크리스트 및 심사 의견서>

      데이터 개요 연구에서 수집 혹은 생산하고자 하는 데이터의 개요

      - 데이터 수집 및 생산 방법이 해당 분야의 통상적인 규범이나 표준적인 방법을 따르고 있는가?

      - 연구 논문의 표나 그림 혹은 보고서의 부록에 수록되는 내용, 예비분석결과, 논문이나 저술의 초안, 연구노트, 보고서 등은 해당되지 않는데 이런 유형의 데이터가 제시되고 있는가?

      - 데이터 파일 포맷 등이 가능한 범위에서 공개된 표준을 따르고 있는가?

      데이터의 저장·보존 데이터의 저장 및 장기적인 보존 계획

      - 구체적인 데이터의 저장 및 장기 보존 계획이 제시되고 있는가?

      - 데이터 저장 방법이나 저장소는 안전성이 있는가? (연구자의 개인 컴퓨터, 연구실 서버 등은 장기적인 보존의 방법으로는 적합하지 않고, 연구기관이 제공하는 보다 안정적인 저장 장소 혹은 서비스가 바람직)

      - 데이터 저장 및 장기 보존 계획이 실현 가능한가? (필요 경비 등)

      데이터 공유 계획 데이터의 공개 및 공유 계획 작성

      - 연구 데이터의 공유 계획이 작성되었는가?

      - 공유 계획이 구체적이고 실현 가능한가? (시기 및 방법)

      - 해당 분야의 통상적인 규범이나 표준적인 방법으로 공유 계획이 작성되었는가?

      - 데이터 공유에 제한이 되는 사항(개인정보, 기밀 유지 필요, 지적재산권 및 잠재적인 상업적 가치 보호 등) 등이 파악되고 그에 대한 대안이 제시되고 있는가?

      - 데이터 파일 이외에 데이터를 이해하기 위해 필요한 도큐멘테이션(예: 설문지, 코드북, readme 파일, 기술 및 보조 문서 등)이 함께 준비되고 있는가?

      - 데이터의 사용에 대한 제한 여부(라이선싱 조건, 엠바고 및 공유 제한 사항)가 파악되고 있는가?

      -

      데이터 관리 책임 데이터의 관리 및 공유 책임자 기재

      - 데이터의 전반적인 관리, 저장 및 공유에 대한 세부적인 사항을 이행할 연구자의 이름 및 연락처가 기재되어 있는가? (복수의 책임자 기재 가능)


      □ 향후 데이터관리계획 이행 여부 추적 필요(데이터의 중요성 혹은 학술적 가치로 인해 향후 관리 및 공유가 필요하다고 판단되는 경우 체크)

      심사의견: (해당 사항 없는 경우에는 “해당 사항 없음”으로 기재)
    • 【 이행여부 검토 】
    • □ 데이터관리계획의 기재 내용에 대해서는 연차보고, 최종보고 등을 통해 그 이행 여부가 확인되어야 하며, 연구책임자에게 피드백이 전달되고 향후 연구계획서 평가에 그 내용이 반영되어야 함
    • □ 생산되는 데이터의 중요성 혹은 가치 때문에 심사과정에서 “추적”으로 식별 된 연구제안서에 대해서는 관리 부서 지정 및 별도의 이행여부 검토 절차 수행
    • □ 앞서 제출된 데이터관리계획에 대한 이행이 이루어지지 않거나 미흡한 경우, 후 속 연구과제에 대한 참여 시 선정 평가에 반영되어야 함
    • □ 데이터관리계획의 이행여부를 점검하기 위해 다음 체크리스트를 기준으로 검토 하며, 연구기관에 따라 필요한 검토항목을 추가하여 활용함
    • <데이터관리계획 이행여부 체크리스트>

      데이터의 수집‧생산 연구데이터의 수집‧생산 방법

      - 데이터 수집 및 생산 방법이 해당 분야의 통상적인 규범이나 표준적인 방법을 따르고 있는가?

      - 연구 논문의 표나 그림 혹은 보고서의 부록에 수록되는 내용, 예비 분석결과, 논문이나 저술의 초안, 연구노트, 보고서 등은 해당되지 않는데 이런 유형의 데이터가 제시되고 있는가?

      - 수집‧생산된 연구데이터는 질적 수준 및 품질에서 우수한가?

      - 데이터 파일 포맷 등이 가능한 범위에서 공개된 표준을 따르고 있는가?

      데이터의 저장‧보존 데이터의 저장 방법 및 장기적인 보존 계획

      - 수집‧생산된 데이터는 적절한 저장소와 방법으로 관리되고 있는가?

      - 구체적인 데이터의 저장 및 장기 보존 계획이 제시되고 있는가?

      - 데이터 장기 보존 계획이 실현 가능한가? (필요 경비 등)

      데이터 공유 계획 데이터의 공개 및 공유 계획 작성

      - 연구 데이터의 공유 계획이 작성되었는가?

      - 공유 계획이 구체적이고 실현 가능한가? (시기 및 방법)

      - 해당 분야의 통상적인 규범이나 표준적인 방법으로 공유 계획이 작성되었는가?

      - 데이터 공유에 제한이 되는 사항(개인정보, 기밀 유지 필요, 지적재산권 및 잠재적인 상업적 가치 보호 등) 등이 파악되고 그에 대한 대안이 제시되고 있는가?

      - 데이터 파일 이외에 데이터를 이해하기 위해 필요한 도큐멘테이션(예: 설문지, 코드북, readme 파일, 기술 및 보조 문서 등)이 함께 준비되고 있는가?

      - 데이터의 사용에 대한 제한 여부(라이선싱 조건, 엠바고 및 공유 제한 사항)가 파악되고 있는가?