정부가 부처·사업·연구자별로 흩어져 있는 바이오 연구 데이터를 통합·수집·제공하는 플랫폼인 ‘국가 바이오데이터 스테이션’을 2021년까지 조성하기로 했다.
국가 3대 중점 육성 사업중 하나인 바이오분야 성장을 가속화하기 위해 인프라를 본격적으로 육성키로 한 것이다.
과학기술정보통신부는 2일 정부서울청사에서 열린 ‘제9차 비상경제 중앙대책본부 회의’에서 이같은 내용의 생명연구자원 빅데이터 구축전략을 발표했다.
생명연구자원 빅데이터 구축 전략은 4대 전략과 10개 추진 과제로 구성됐다.
4대 전략은 ▲데이터 기반 바이오 연구 환경 구축 ▲수요자 맞춤형 바이오 소재 활용 촉진 ▲바이오 재난 대응을 위한 인프라 비상 운영 체계 정립 ▲지속 성장 가능한 민관 협력 기반 조성 등이다.
먼저 데이터 기반 바이오 연구 환경 구축을 위해 범 부처가 협력해 국가바이오 데이터 스테이션을 조성한다.
‘국가 바이오 데이터 스테이션’은 효율·전문·안정적 운영을 위해 범부처 바이오 연구 데이터 통합 관리기관인 국가생명연구자원정보센터(KOBIC), 한국과학기술정보연구원(KISTI) 등의 협력 체제로 구축하고, 연구자 및 데이터 전문가가 참여하는 ‘데이터 운영위’를 구성·운영한다.
복지부 임상유전체생명정보시스템(CODA), 농진청 농생명정보센터(NABIC) 등과 같은 부처 데이터 센터 및 소재 클러스터 DB를 실시간 연계(API 방식)하고 신규 데이터 센터 구축 시 데이터 스테이션의 컴퓨팅 리소스로 활용한다.
국가 바이오 R&D를 통해 생산·활용되는 생화학분석, 이미지(영상), 임상 및 전임상, 유전체, 분자구조, 표현형 정보, 화학반응 등의 모든 데이터(제3자 제공 동의를 받은 익명화된 임상 데이터 등 포함)를 수집한다.
연구자들이 손쉽게 빅데이터를 등록할 수 있는 ‘원 클릭 등록 시스템’을 개발·운영하고 범부처 R&D 과제 지원 통합 시스템과 데이터 스테이션 시스템을 연계 운영함으로써 연구현장의 정보 입력을 최소화한다.
이용자 편의성 증대를 위한 연구자 지원 상담 서비스를 운영하고 통합 로그인·연계 검색 등 부처 데이터센터, 소재 클러스터와 연계해 운영한다.
지속적인 데이터 수집을 위한 관리 제도도 마련한다. R&D로 생산된 데이터가 데이터 스테이션에 수집될 수 있도록 ‘국가생명연구자원 수집·관리 표준지침’을 제정하고 데이터 등록 시 인센티브를 제공해 양질의 데이터 공유를 유도한다.
민·관 합동 ‘바이오 데이터 표준화 위원회’를 구성, 국가 등록 표준(안)도 마련한다.
임상 연구 데이터도 함께 제공함으로써 데이터 가치를 제고한다. 바이오 R&D사업에서 생산되는 임상 연구 데이터를 임상유전체생명정보시스템(CODA, 복지부)과 데이터 스테이션에서 수집·제공하고 임상 연구 데이터가 개정 개인정보보호법 체계 하에서 안전하게 연구에 활용될 수 있도록 가명처리 방법, 절차 등을 담은 가이드라인을 마련한다.
데이터 활용 지원을 위한 인프라도 제공한다. 연구자별 데이터 저장공간과 가상 협업 연구 환경을 제공하고 클라우드 기반 데이터 분석 툴 활용 플랫폼의 개발 및 지원(H/W, S/W 등)에 나선다.
데이터 분석 전문 벤처를 육성해 연구자, 중소기업 등 데이터 활용을 지원하고 축적된 데이터, 분석툴 등 활용한 AI기반 R&D 지원을 지속적으로 확대한다.
연구 데이터 신속 공유 및 실물 소재정보와 연계를 추진한다. 과제기간 중 보호되는 미공개 데이터가 파트너십 체결을 통해 공유될 수 있도록 매개하고 소재자원은행이 보유한 실물 소재정보와 개별 연구자가 생산한 실물 소재 유래 분석 정보(연구데이터)를 연계 제공(실물 소재별 연구 데이터 누적·활용 가능)한다.
데이터의 글로벌 활용 기반도 마련한다. 고품질·고유 국내 데이터를 기반으로 글로벌 데이터 협의체에 참여를 추진하고