국립보건연구원, 21만 명의 보건의료 연구데이터 공개
- 21만 명 보건의료 연구데이터의 클라우드 활용 플랫폼 구축 완료
- 다양한 연구자들의 데이터 활용 과제 공모 시작(10.29.)
질병관리청(청장 지영미) 국립보건연구원(원장 박현영)은 21만 명 보건의료 연구데이터의 클라우드* 활용 플랫폼(OPEN KoGES**)을 구축하고, 10월 29일(화)부터 다양한 연구자들의 데이터 활용 과제 공모를 시작한다.
* 클라우드 : IT 자원을 사용자가 필요할 때마다 인터넷을 통해 이용하는 방식
** OPEN KoGES : 한국인역학조사사업(Korea Genome and Epidemiology Study: KoGES)에서 생산한 21만 명의 코호트자료를 통합검색부터 분석 인프라까지 지원하는 클라우드 서비스 플랫폼(붙임 1 참고).
이번에 공개하는 공유 플랫폼은 제한적인 데이터의 규모와 활용 측면에서 벗어나, 연구자들에게 데이터의 접근성과 안정적인 분석환경을 제공하여 임상·역학데이터와 유전체 데이터를 통합하여 분석할 수 있도록 개선하였다.
【주요 개선 내용】
구분 | 현재 |
| 개선 후 |
분석 형태 | · 온프레미스* 방문 분석 | · 원스탑 클라우드 원격 분석 | |
데이터 규모 | · 임상·역학 211,562명 · 유전체 72,291명 | ·임상·역학 211,562명+유전체 161,583명 | |
분석방법 | · 기초통계분석, 회귀분석 | ·기초통계분석, 회귀분석 ·(시계열분석) 반복측정자료분석, 생존분석 |
* 온프레미스(on-premise) : IT시스템과 소프트웨어를 자체 유지관리하고 물리적인 공간에 직접 설치하고 운영하는 방식
이를 통해 국립보건연구원이 보유 중인 보건의료 연구데이터 중 가장 활용도가 높은 한국인유전체역학조사사업(KoGES)의 데이터를 연구자가 편리하게 사용할 수 있는 환경*을 제공하며, 표준화된 임상·역학 데이터(21만 명)와 함께 기존 7만여 명에서 2배 이상 확대된 16만 명의 유전체 데이터를 공개한다.
* 그래픽 사용자 환경(GUI, graphic user interface) : 명령이나 텍스트를 입력하는 것이 아니라, 사용자가 아이콘, 메뉴, 버튼, 창 등의 그래픽요소를 사용, 컴퓨터 등 디지털기기와 상호작용할 수 있는 시각적 환경
그 간은 각각의 임상·역학 데이터와 유전체 데이터를 별도로 분석해 활용하였으나, 개선된 데이터 활용 플랫폼에서는 임상·역학데이터와 결합된 유전체 데이터를 같이 제공함으로써 시간 흐름에 따른 질병 발생과 유전적 요인의 비교 연구도 가능해진다.
또한, 보다 빠르고 편리한 데이터 제공을 위해 데이터 제공 절차를 간소화하고, 국립보건연구원에 직접 방문 없이 연구실 등에서 원격으로 접속하여 데이터의 검색부터 고급 분석까지 한 번에 가능해진다.
아울러 클라우드 네이티브 방식*을 도입하여 데이터의 신속성, 안정성, 확장성 등을 강화하여, 연구자가 데이터를 편리하고 안전하게 접근할 수 있게 된다.
* 클라우드 네이티브 : 시스템의 설계단계부터 클라우드 기술을 적용해 클라우드의 장점을 최대한 활용할 수 있는 방식
클라우드 서비스는 연구자들이 과제 공모를 통해 활용할 수 있도록 보건의료연구자원정보센터 누리집(coda.nih.go.kr)에서 10월 29일(화)부터 11월 11일(월)까지 신청을 받을 예정이다.
국립보건연구원은 추후 연구자 대상으로 클라우드 활용을 통한 분석(초·중급, 고급과정) 교육을 지원하고, 성과를 교류할 수 있는 기회의 장을 마련해 누구나 쉽게 데이터 활용이 가능하도록 할 예정이다.
박현영 국립보건연구원장은 “이번 OPEN KoGES 클라우드 플랫폼 구현은 산·학·연·병 연구자 모두에게 보건의료 연구데이터의 접근성을 높여, 정밀의료와 데이터 기반 보건의료연구의 중심축으로 자리잡길 기대한다”며,
“지속적으로 연구자들에게 필요한 보건의료 연구데이터 활용 서비스를 적극 개발하고 개방할 예정“이라고 밝혔다.
최신 기관 소식
기관별 서비스 Best 5