본문으로 바로가기 본문으로 바로가기 주메뉴 바로가기

뉴스

[데이터활용] 새로운 연구 패러다임을 이끌 연구데이터 플랫폼
등록일 : 2020-11-26 조회수 : 156

2019년 인류 최초로 블랙홀의 이미지 관측에 성공한 ‘사건의 지평선 망원경(Event Horizon Telescope, EHTEHT)’ 프로젝트에는 전 세계 과학자 200여 명이 참여했다. 노벨과학상도 2000년 이후 공동 수상한 비율이 무려 90퍼센트에 달한다.

이처럼 연구데이터의 공유와 협업이 중요해졌고, 데이터 개방과 공유는 필수가 됐다. 2017년 이코노미스트 기사에서 볼 수 있듯 ‘세계의 가장 가치 있는 자원은 이제 오일이 아닌 데이터’다.

이번에는 데이터 가운데서도 연구자들이 피땀 흘려 만든 ‘연구데이터’들을 공유하고 활용할 수 있는 국가연구데이터플랫폼 DataON을 알아보려 한다.


연구 패러다임의 변화, 데이터 공유에서 시작!

코로나19 극복을 위해 전 세계 과학자들이 협업해 코로나 바이러스 분석과 백신 개발에 힘쓰고 있다. 협업을 이끌 수 있는 개념인, 연구데이터를 누구나 보고 활용할 수 있는 ‘오픈사이언스’는 더욱 주목받게 됐다.

뿐만 아니라 4차 산업혁명 시대, 연구 패러다임의 대전환으로 데이터, 인공지능, 빅데이터 기술 등 ICT를 통해 새로운 과학적 발견 및 사회 현안 문제를 해결하고 있다. 하지만 체계적으로 관리되는 해외의 연구데이터에 비해 우리나라의 연구데이터 활용은 미비한 편이다. 대부분의 데이터 과학자가 연구 시간의 약 80퍼센트를 데이터 수집 및 전처리 과정에 사용하는데도 말이다.

국가적 차원의 연구데이터 활용과 공유·연계를 위한 플랫폼 구축 및 서비스 운영 필요를 느낀 과학계와 정부는 2013년부터 거버넌스 체제를 마련해 연구데이터 전문센터, 정부출연연구소, 대학의 연구데이터를 모으기 시작했다. 2018년 12월 17일 국가 연구데이터 플랫폼 시범 서비스를 오픈했다.

국가연구데이터플랫폼 ‘DataON’

세계적인 데이터 강국으로 가는 중심! DataON 국가연구데이터플랫폼

DataON은 오픈사이언스 시대에 발맞춰 공유 기반의 혁신을 마련하기 위한 국가연구데이터플랫폼이다. 연구데이터 전문센터, 정부출연연구소, 대학에서 생산한 데이터를 등록·관리하고, 검색 및 다운로드, 커뮤니티 지원, 연구데이터 분석 환경 지원 기능을 제공한다.

그런데 연구데이터는 정확하게 무엇일까? 연구데이터는 국가R&D 사업 중 각종 실험, 관찰, 조사, 분석 등을 통해 산출된 자료로, 연구 성과 재현에 필수적이고 객관적인 사실 데이터를 말한다.

DataON은 체계적인 연구데이터의 관리 및 공유 서비스 제공을 위해 국내외 기관들과의 표준화된 연계 방식을 제공한다. 또한 국내 데이터 전문 센터인 KISTI의 GSDC, 한국정보화진흥원의 AI hub, 한국지질자원연구원의 연구데이터를 메타데이터 수준에서 연계를 완료했다. 유럽 최대 연구데이터 플랫폼인 OpenAIRE, 호주 국가연구데이터 플랫폼인 ARDC, 일본 IRDB 등과도 연계돼 메타데이터를 이용할 수 있다.

플랫폼의 데이터들은 자동 연계 수집되므로, DataON을 통해 유럽, 호주, 일본 등의 연구데이터를 통합 검색할 수 있다. 앞으로 미국, 중국 등의 연구데이터 플랫폼과도 연계하기 위해 노력하고 있다.

DataON에 ON 해야 하는 이유

국가연구데이터플랫폼 DataON은 연구 기획부터 결과물 등록까지 연구의 전 과정을 지원해 연구에 필요한 시간과 비용을 획기적으로 단축할 수 있게 해준다. 뿐만 아니라 분야 간 연구자 연계 서비스를 통해 이전에는 어려웠던 데이터 기반 융합 연구를 기획·실행이 가능해졌다.

DataON에 접속해야 하는 보다 자세한 이유를 들여다보자.

① 세계 주요 국가들의 연구데이터 플랫폼과 연계, 전 세계 연구데이터를 원스톱 검색할 수 있다. 또한 정부출연연구소, 대학, 국내외 연구데이터 전문 센터가 생산한 다량의 연구데이터를 손쉽게 수집, 검색, 활용하도록 도와 불필요한 시간, 비용 낭비를 없앴다. 쓸모가 많은 이미지 자료 검색도 가능하다.

② 연구 편의성을 위한 분석 및 저장 공간인 마이드라이브를 제공해 데이터 처리 효율성을 높였다.

③ GPU를 활용한 AI 분석이 가능하도록 공개된 분석 도구와 빅데이터를 손쉽게 활용할 수 있는 클라우드 분석 환경을 제공해 연구자들의 연구 편의를 크게 높인다. 데이터를 온라인에서 분석할 수 있는 워크플로우, Jupyter 기반 개인별 분산 클라우드 분석 환경을 2020년 12월 오픈할 예정이다.

④ 이용자 간 교류를 돕는 커뮤니티 지원 기능이 있어 이전에는 어려웠던 공동연구, 융합연구를 활성화해 새로운 연구 가치를 창출한다.

⑤ 정부 및 정책 입안자는 DataON으로 연구자들의 연구 행태를 분석할 수 있어 연구개발 예산을 효율적으로 투자, 편성할 수 있다.

DataON이 가져올 연구 환경의 변화

연구 환경 변화, 실험 및 측정 장비 발달 등으로 연구데이터가 대량으로 생산됐다. 연구자들이 자신의 연구 공간에서 데이터를 쉽게 찾을 수 있고, 바로 분석·활용할 수 있는 환경이 제공된다면 데이터 기반 연구를 더욱 가속화시킬 수 있을 것이다.

이를 위해 국가연구데이터플랫폼인 DataON이 만들어졌다. DataON에서는 연구개발 전 과정을 편리하게 지원하기에 연구자, 기업인, 시민 과학자 누구나 자신의 데이터를 등록하고, 필요한 데이터를 검색하고, 분석할 수 있다. 더불어 KISTI가 운용하는 슈퍼컴퓨팅 인프라를 지원받거나 DataON이 연계하는 세계 각국의 연구 성과물을 원스톱으로 확인할 수 있다.

DataON이 앞으로 탄탄하게 자리 잡는다면, 각 연구자의 데이터를 서로 개방 및 공유해 데이터 품질이 높아지고 연구윤리 문제도 해결될 것으로 기대된다. 무엇보다 연구데이터의 재사용성이 높아지고 중복 연구를 최소화하는 등 연구데이터가 활발히 공유, 활용돼 산학연의 R&D 혁신을 만들어내는 지름길이 열릴 것이다.




NTIS에서 연구데이터를 검색하는 방법에 대한 카드뉴스도

곧 발행할 예정입니다~.

많은 기대 부탁드립니다.