제보
주요뉴스 산업

[디지털바이오 융합] ① 염색체부터 전임상까지…전국민 바이오데이터 활용법 겨룬다

기사등록 : 2023-05-23 10:06

※ 뉴스 공유하기

URL 복사완료

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게
디지털융합 등 바이오연구 패러다임 전환
구글 알파폴드로 디지털융합 신기원 마련
바이오 데이터 활용 대회 6월말까지 신청

디옥시리보핵산(DNA)가 이중나선 구조로 돼 있다는 것이 발견된 지 올해로 70주년이 됐다. DNA에는 생물의 복잡한 정보가 담겼다. 이를 토대로 생체고분자 분석기술이 발전되고 국제사회는 생명유전정보 연구에 팔을 걷었다. 우리나라 역시 국가 바이오데이터 스테이션(K-BDS)을 구축해 이제는 디지털바이오 융합 연구에 박차를 가하고 있다. 이에 <뉴스핌>은 인공지능 시대 속 디지털바이오 연구의 현주소를 진단하고 향후 바람직한 대응책을 모색해 본다.

[세종=뉴스핌] 이경태 기자 = "바이오 연구는 새로운 차원으로 발전해 유전학, 유전체학 등의 미스테리를 풀었습니다."

바이오 연구를 도맡아온 한국생명공학연구원의 한 연구자의 평가다. 더구나 코로나바이러스감염증-19로 인한 팬데믹 상황에서 빅데이터 분석은 인류가 치명적인 감염병을 극복할 수 있는 해결책을 제시했다.

실제 빅데이터 분석은 표적 식별부터 시작해 임상 시험, 실시간 모니터링, 배포 전략, 부작용 감시에 이르기까지 코로나19 백신 개발의 모든 단계에서 중요한 역할을 했다. 빅데이터를 사용해 연구 프로세스를 가속화하고 증거를 기반으로 하는 의사 결정을 가능하게 했다. 전세계적으로 COVID-19 백신의 성공적인 개발 및 배포에도 기여했다.

'자연 관찰의 시대에서 디지털융합 시대로'…바이오연구 패러다임 변화

인류가 출현하기 전부터 다양한 생물이 존재했다. 인류는 바이오 연구의 역사를 구분할 때 크게 ▲자연관찰의 시대(~18세기) ▲미생물 연구 시대(19세기) ▲유전자 연구 시대(20세기) ▲디지털 융합 시대(21세기) 등으로 나눴다.

기원전부터 시작해 자연관찰의 시대에서는 신학과 과학의 구분이 모호했다. 생물체에 대한 이해 부족으로 자연발생설을 믿게 된다. 이를 두고 아리스토텔레스는 생물은 자연스럽게 생겨나는 것으로 정의했다.

이후 미생물 연구 시대에서 미생물, 질병, 멸균 등이 연구됐다. 미생물 존재, 이에 따른 부패와 질병 발병 원인을 발견했다. 이때 비로소 과학적 바이오 여누의 기틀이 마련됐다. 파스퇴르는 플라스크 가열 실험으로 생물속생설을 입증했다. 

생물속생설은 생물이 모두 그 어버이로 인해 생긴다고 주장하는 이론이다. 생물은 무생물에서 자연적으로 만들어진 것이라는 자연발생설에 대응하는 개념이다.

DNA의 이중 나선 구조 모습 [자료=게티이미지뱅크] 2023.04.24 biggerthanseoul@newspim.com

20세기 들어 1853년 DNA의 이중나선구조가 처음으로 발견됐다. 

1953년 4월 25일 제임스 왓슨(James Watson)과 프랜시스 크릭(Francis Crick)은 유전 정보를 다음 세대로 전달하는 물질인 DNA의 구조가 이중나선형이라는 내용이 담긴 논문을 '네이처'에 발표했다. 이들은 9년 뒤 노벨 생리의학상을 수상하기도 했다.

유전자 연구를 통해 RNA와 단백질 등을 분자단위로 연구하는 분자생물학도 발전했다. RNA는 핵산의 일종으로, 유전자 본체인 디옥시리보 핵산(DNA)이 가지고 있는 유전정보에 따라 필요한 단백질을 합성할 때 직접적으로 작용하는 고분자 화합물을 말한다.

21세기로 들어서면서 바이오 연구는 신기원을 맞게 된다.

바로 디지털 융합 시대인 것이다. 인간게놈 유전자 지도가 2000년에 발표되고 생물정보학 시대가 본격화됐다. 인공 세포를 제작해 활용하는 합성생물학도 함께 발전했다. 

AI‧빅데이터를 활용해 생명현상에 대한 분석‧예측을 할 수 있게 됐다. 디지털과 바이오가 결합하면서 생명연구에 대한 다양한 도전과제에 접근할 수 있게 됐다.

구글 알파벳의 딥마인드가 개발한 인공지능 플랫폼인 알파폴드. 알파폴드는 단백질 접힘 연구에서의 난점을 돌파하기 위해 딥러닝 알고리즘을 활용해 개발됐다. 단백질 접힘 연구를 시뮬레이션한 모습 [자료=딥마인드] 2023.05.22 biggerthanseoul@newspim.com

디지털과 바이오의 융합은 2018년 구글 모기업인 알파벳의 딥마인드 부서가 내놓은 '알파폴드' 이후 새로운 변화를 가져왔다. 알파폴드는 단백질 구조 예측 AI 플랫폼이다. 2022년 7월 28일 딥마인드는 알파폴드를 통해 이제까지 알려진 거의 모든 단백질 구조를 예측하는 데 성공했다.

과학기술정보통신부 한 관계자는 "이제는 바이오 분야의 연구를 하기 위해서는 빅데이터를 학습해 최대한의 효율을 끌어올릴 수 있도록 AI 기술을 접목할 때"라며 "디지털 바이오라는 측면에서 바이오 데이터를 충분히 축적해 인류의 과제를 해결하는 데 활용할 수 있을 것"이라고 전망했다.

'바이오 데이터의 가치를 높여라'…바이오 데이터 활용 경진대회 전개

과기부 역시 그동안 축적해놓은 바이오 데이터의 가치를 높이기 위해 빅데이터 활용에 초점을 맞췄다.

과기부는 지난달 25일부터 오는 10월 31일까지 '2023년 바이오데이터 활용 경진대회'를 연다. 이번 경진대회는 생명공학‧정보통신(ICT) 분야를 공부하는 학생 등 국민의 바이오 데이터에 대한 관심을 유도하기 위해 열리게 되는 것이다.

지난해 12월부터 본격적으로 운영되고 있는 범부처 바이오 연구데이터 통합 공유 플랫폼인 국가 바이오 데이터 스테이션(K-BDS)을 활용, 바이오 데이터의 가치를 높이는 데이터 활용 사례를 발굴하기 위해서다.

과기부는 지난달 25일부터 오는 10월 31일까지 '2023년 바이오데이터 활용 경진대회'를 연다. [자료=과학기술정보통신부] 2023.05.22 biggerthanseoul@newspim.com

바이오 연구데이터에 관심이 있는 국민이면 누구나 개인 또는 팀 단위로 경진대회에 참가할 수 있다. 우선 다음달 30일까지 K-BDS 누리집에 참가 신청서를 제출하면 된다.

참가자 (팀)중 7월 말 1차 서면 심사에서 데이터 활용 최종 수상자(팀)의 4배수 가량이 선정된다. 10월 중순 2차 발표심사에서 데이터 활용 결과에 대한 심사를 진행해 수상자가 결정된다.

참가자(팀)는 K-BDS에 등록된 데이터를 사용해야 한다. 참가자(팀)가 보유한 데이터 또는 국 내‧외에 공개된 데이터를 활용하고자 할 경우에는 6월 30일까지 K-BDS에 등록한 뒤 사용해야 한다.

1차 서면심사를 통과한 2차 심사 대상자(팀)는 K-BDS의 분석환경에서 데이터 분석을 수행한다. K-BDS는 유전체 빅데이터 분석 환경(Bio-Express)과 고성능 GPU 장비 기반의 인공지능(AI) 개발 및 데이터 분석 환경 등으로 구축돼 연구자가 손쉽게 사용할 수 있다.

이번 경진대회를 위해 ▲차세대 염기서열(NGS) 분석 ▲마이크로 어레이(Microarray) 데이터 ▲단백체 데이터 ▲대사체 데이터 ▲화합물 데이터 ▲이미지 데이터 등을 제공한다. 

이번 경진대회에서는 K-BDS에서 제공된 다양한 데이터를 활용하는 데이터 활용 부문과 K-BDS 플랫폼, 정책, 기술의 혁신적인 아이디어를 선정하는 혁신 아이디어 부문으로 나눠 시상한다.

이창윤 과기부 연구개발정책실장은 "바이오 분야에 우리나라가 앞서있는 디지털 기술과 융합을 통해 연구 효율성과 산업의 생산성을 높이기 위해서는 바이오 데이터의 적극적인 공유와 활용이 필요하다"며 "이번 경진대회를 통해 바이오 데이터에 가치를 더해 활용성을 높이는 성과들이 나오길 기대한다"고 말했다.

biggerthanseoul@newspim.com

(※ 본 기획보도는 한국생명공학연구원의 지원을 받아 작성되었습니다.)

<저작권자© 글로벌리더의 지름길 종합뉴스통신사 뉴스핌(Newspim), 무단 전재-재배포 금지>