메인메뉴로 이동 본문으로 이동

컨텐츠 내용

  1. 고객센터
  2. OSS뉴스

OSS뉴스

OSS뉴스 조회 페이지
"착한 해킹을 허용하라"… 코로나 데이터 개방 목소리 커져 관리자 / 2020.04.10

 

"착한 해킹을 허용하라"… 코로나 데이터 개방 목소리 커져

 

정부 주도 방역 대책 한계… "참여자 늘어야 ‘혁신’ 나온다"

"미국⋅대만 등 사례 참고해 오픈포맷 데이터 비중 높여야"

NYT "코로나로 전세계 국경 장벽 커졌지만 과학계 전례없는 협업 시도"


신종코로나바이러스감염증(코로나19)이 전세계적으로 확산하고 있는 상황에서 해당 바이러스에 대한 연구 및 검증이 활발히 시도되고 있지만 데이터 장벽이 걸림돌로 부상하고 있다. 이에 각국이 임상케이스 등을 포함한 질병데이터를 오픈포맷 형태로 공개해 기존 의학계뿐만 아니라 첨단 ICT 기업들을 비롯해 일반 대중의 접근성을 더 늘려야 한다는 목소리가 커지고 있다. 데이터 공유를 위해 정부의 데이터 독점과 국경간 장벽을 허물라는 것이다.


최근 주목받고 있는 시빅해킹(Civic Hacking) 등 '의외의 혁신'을 통해 코로나19에 보다 창의적인 대응을 할 수 있다는 점에서도 데이터 개방은 필수적이다. 시빅해킹이란 말그대로 '착한 해킹'을 뜻하는 말로, 지역사회 문제를 사회 구성원인 시민이 직접 해결하는 사회 운동을 말한다. IT업계의 오픈소스 운동에서 아이디어를 빌린 이 운동은 정부가 해결하지 못하는 지역사회 문제 등을 창의적인 기업, 일반 시민들이 해결한다는 개념이다.


뉴욕타임스(NYT)는 최근 "코로나 사태로 정치지도자들이 국경을 잠그고 있지만 과학자들은 그들의 국경을 허물고 역사상 유례없는 글로벌 협업을 하고 있다"고 보도했다. 코로나 치료제와 백신 개발을 위한 이 같은 협업을 위해서도 데이터 공유 환경 조성을 위한 개방이 시급하다는 지적이다.


사용자의 생년월일과 이름을 입력하면 근처에 구매할 수 있는 약국 정보를 제공하는 사이트 ‘마스크맵’ 캡처.


9일 한국정보화진흥원(NIA)의 '해외 주요 질병관리 통제 기관의 데이터 공개 현황' 보고서를 살펴보면 코로나19와 관련해 각국 정부가 공개한 질병 데이터 중 미국은 93%, 대만은 100% 수준이 오픈포맷으로 공개해 데이터에 대한 접근이 용이한 반면 한국, 독일, 영국 등은 일부 자료만 오픈포맷으로 공개하고 있는 것으로 나타났다.


코로나19의 발병지이자 가장 많은 임상 정보가 축적돼 있는 중국의 경우 이같은 오픈데이터로 정보를 공개하기보다는 일부 연구기관의 보고서만 발표되고 있어서 보고서상에서는 언급되지 않았다.


정윤석 NIA 공공데이터기획팀 주임연구원은 보고서에서 "OECD(경제협력개발기구)는 한국의 코로나19 관련 공공데이터 개방 노력과 민간 활용에 대해 높이 평가했지만 개선이 필요한 실정"이라며 "모든 질병 데이터를 관리하는 질병관리본부의 경우 통계 수치 데이터 위주로 공개하고 있어서 민간활용이 어렵다"고 지적했다.


오픈포맷 데이터란 말그대로 디지털 자료 저장을 위한 규격으로 누구나 자유롭게 사용할 수 있는 데이터를 말한다. 미국 질병통제예방센터(CDC)의 경우 14개의 카테고리별 데이터셋을 분류 제공하고 있는데 감염병뿐 아니라 장애, 폭력, 흡연, 뇌손상, 건강 관련 통계 자료 등의 대부분을 오픈포맷으로 제공하고 있다. 일반인들도 쉽게 이들 데이터에 접근할 수 있다.


대만의 경우 아예 100%의 데이터를 오픈포맷 형태로 제공하고 있다. 대만 CDC는 오픈 데이터 포털을 별도로 구축해 포털 내 305개의 질병과 관련한 데이터를 개방해 제공하고 있다. 기계 판독이 가능한 오픈 포맷 형식으로 데이터를 개방해 기업이나 일반인들이 자유롭게 데이터를 수정하거나 편집할 수 있도록 제공하는 것이 특징이다. 실제 코로나19 발발 이후 3만여건에 육박하는 데이터(연령, 성별) 등의 다운로드가 이뤄진 것으로 나타났다.


NIA는 한국의 경우 특정 질병 발생수 결과를 CSV(쉼표를 기준으로 항목을 구분해 저장한 데이터) 형태 등으로 다운로드 할 수 있도록 지원하고 있지만 RDF(resource description framework) 등 높은 수준의 오픈포맷 단계의 데이터를 지원하지 않아 한계가 있다는 지적이다. RDF는 서로 다른 응용 프로그램끼리의 데이터 교환이 효율적으로 이뤄지는 높은 수준의 개방형 데이터로, 특히 IT 기업들이 빠르게 응용할 수 있다.


실제 이같은 오픈포맷 데이터를 활용한 '착한 해킹'의 성과는 제한적인 데이터 공개로도 이미 성과를 입증하기도 했다. 한 예로 한국의 시빅해커들은 정부가 개방한 공적 마스크 재고 API(애플리케이션 프로그램 인터페이스)를 활용해 앱 및 모바일 웹서비스(웨어마스크, 마스크사자 등)를 개발한 바 있다. 이들은 코로나19 공공데이터 공동대응팀을 꾸려 행안부와 NIA 등에 코로나19 확산 방지에 필요한 공공데이터를 요구하기로 했다.


코로나19가 본격적으로 확산하기 시작한 2월초에는 한 대학생이 질병관리본부에서 제공하는 데이터를 바탕으로 확진자의 동선을 한 눈에 알아볼 수 있는 온라인 지도를 제공해 폭발적인 조회수를 기록하기도 했다. PC, 모바일에서 모두 확인할 수 있는 이 지도는 확진자의 이동경로뿐 아니라 격리장소, 확진자수, 유증상자수 등도 확인할 수 있다.


IT업계 관계자는 "최근에는 정부도 이같은 시빅해킹의 중요성과 효용성을 빠르게 인지하고 적극적인 소통에 나서는 분위기로 바뀌었다. 초기에 등장한 이같은 코로나맵 등이 신선한 충격을 안겨준 것으로 보인다"며 "다만 RDF나 다양한 API를 제공해 더 많은 참여를 이끌어낼 필요가 있으며 특히 확진자수가 집중돼 있는 대구⋅경북 지역에 데이터 입력 인력을 더 투입해 유의미한 정보 체계를 구축할 필요가 있다"고 강조했다.

 

(출처) https://biz.chosun.com/site/data/html_dir/2020/04/09/2020040903725.html (ChosunBiZ)