포스테키안

2020 봄호 / 기획특집 ③ / 코로나19

2020-06-02 59

기획특집 ③ / 코로나19 : 백신 개발의 어려움과 극복을 위한 노력

앞서 이야기한 것처럼, 전 세계의 연구자들이 신약과 백신 개발에 몰두하고 있습니다.

하지만 그 과정에는 여전히 여러 가지 걸림돌들이 존재하고, 백신이 개발된다고 하더라도

SARS-CoV-2의 특성으로 인해 또다시 어려움에 직면할 수 있다고 합니다. 여러 분야의 전문가들이 그 해결책을 찾고자 연구 중이라고 하는데요. 코로나19의 백신 개발이 어려움을 겪는 이유를

과학적인 측면에서 살펴보고 그러한 장애물을 뛰어넘기 위한 또 다른 분야의 노력까지, 지금부터 알아봅시다!

 

백신 개발이 어려움을 겪는 이유

백신의 개발 과정에서 안정성을 시험하는 것은 매우 중요한 일입니다. 하지만 생쥐 등 소형 동물부터 영장류, 사람에 대한 임상 시험까지 진행하는 데에는 수년의 시간이 소요되고 완성된 백신이 시판 허가를 받기까지의 과정도 까다롭다고 합니다. 또, 임상 시험과 그 이전의 개발 단계에서 사용할 동물 모델 탐색 역시 쉽지 않습니다. SARS-CoV-2는 동물 실험에서 가장 보편적으로 사용되는 동물인 생쥐가 연구에 적합하지 않다고 하는데요. 생쥐와 인간의 ACE2는 구조적 차이가 존재해 SARS-CoV-2가 생쥐의 ACE2 수용체에 상대적으로 낮은 결합력을 보였기 때문이라고 합니다. 이에 연구자들은 인간의 ACE2 수용체를 발현하는 마우스 모델의 개발 등 다양한 노력을 하고 있지만, 다른 동물을 탐색하거나 새로운 해결 방안을 찾는 과정은 백신 개발의 속도를 늦추고 있습니다.

게다가 SARS-CoV-2는 RNA 바이러스이기 때문에 변이가 잘 일어난다는 특성이 있어 과학자들에게 또 다른 과제를 안겨주었습니다. 그렇다면 RNA 바이러스는 왜 변이가 잘 일어나는 걸까요? 먼저 RNA는 단일 가닥이라는 점, 화학 반응이 잘 일어나는 수산기(-OH)를 가지고 있다는 점 때문에 화학 반응이 잘 일어납니다. 따라서 RNA 단일 가닥은 스스로 접히고 상보적인 염기쌍끼리 결합하여 독자적이고 다양한 2차 구조를 형성하기도 하며 그에 따라 바이러스의 특성 또한 달라집니다. 또한, RNA 바이러스는 DNA와 달리 유전자를 복제하는 동안 돌연변이가 발생해도 이를 자체적으로 수정할 수 있는 교정 기작이 존재하지 않습니다. 그래서 복제 도중, 한번 염기서열의 변화가 발생하면 그대로 변이가 진행됩니다. 백신이 개발되는 사이에 이러한 이유로 변이가 일어나면 다시 새로운 백신을 개발해야 합니다.

 

RNA 예측 알고리즘 ‘LinearFold’

앞서 말한 문제점을 해결하고, 이른 시일 내에 백신을 만들고자 생명과학 분야뿐만 아니라 다양한 분야의 연구자들이 노력하고 있습니다. 그중 대표적인 것이 생명과학과 컴퓨터 공학 기술이 융합된 RNA 예측 알고리즘 ‘LinearFold’입니다. 리니어폴드는 RNA가 2차 구조를 형성할 때 안정적인 상태로 변이가 일어난다는 것을 이용해 RNA의 구조적 변이를 예측하기 위해 개발된 알고리즘입니다. 이 리니어폴드는 이번 코로나 사태에 대응하고자 모든 연구자가 이를 함께 공유하고 활용할 수 있도록 오픈 소스로 공개되었다고 합니다. 그렇다면 어떤 알고리즘으로 변이를 예측하는지 자세히 알아볼까요?

리니어폴드는 RNA 염기 서열을 왼쪽에서 오른쪽으로 하나씩 스캔하면서 한 단계마다 push, skip, pop 중 하나의 동작을 실행해, 주어진 서열로 만들 수 있는 모든 2차 구조 상태를 계산합니다. 이때 push는 그 단계 이후에 스캔 되는 뉴클레오타이드와 결합하는 경우, skip은 결합하지 않는 경우, pop은 그 단계 이전에 push를 거친 뉴클레오타이드와 결합하는 경우를 말하고 프로그램상에서 각각 “(” , “.” , “)”로 표기됩니다. 이렇게 모든 경우를 만들고 각각의 점수를 계산해 가장 점수가 높은, 즉 가장 안정적인 상태를 선택하게 됩니다. 점수는 뉴클레오타이드의 결합 쌍에 1, 단일 뉴클레오타이드에 0.1과 같이 각각의 상태가 안정도에 영향을 미치는 정도에 따라 일정한 값을 부여하고 그 모든 값을 더해 계산합니다.

① LinearFold를 통해 예측되는 RNA 2차 구조

   (출처 LinearFold: linear-time approximate RNA folding by 5′-to-3′ dynamic programming and beam search)

계산 과정에는 ‘stack’이라는 개념도 도입됩니다. stack은 ‘push 단계를 거친 뒤 뉴클레오타이드와 결합한다는 건 확정됐지만, 아직 어느 것과 결합할지 특정되지 않은 경우’에 해당하는 뉴클레오타이드 순서를 표기한 것을 말합니다. 예를 들어 세 번째 단계까지 연산했을 때 “. ( (“로 표기되는 경우는 스택이 [2 3], “. ( .”인 경우는 [2]이고, “. . .” 또는 “. ( )”과 같은 경우는 스택이 비어있다고 말합니다. 이 스택은 단계를 거칠 때마다 점수와 함께 연산합니다.

② LinearFold가 진행되는 방식

   (출처 LinearFold: linear-time approximate RNA folding by 5′-to-3′ dynamic programming and beam search)

여기에 계산 과정을 간략하게 하기 위한 3가지 아이디어가 더해집니다. 첫 번째 아이디어는 같은 스택을 갖는 상태는 하나로 합쳐서 생각해 뒤의 동작을 실행해 계산하고, 그 상태 중 가장 높은 점수를 가지는 것만 저장한다는 것입니다. 스택이 같다면 앞의 기록과 관계없이 뒤에서 이어질 동작에 대한 경우의 수와 그에 따른 추가 점수가 모두 같고, 그렇게 된다면 가장 점수가 높은 상태가 아닌 경우는 더 연산할 필요가 없기 때문입니다. 두 번째는 스택에서 가장 뒤에 있는 숫자가 같은 경우는 그 순서에 있는 뉴클레오타이드가 뒤에 나오는 것과 연결될 때까지 모두 하나의 경우로 합쳐서 생각한다는 것입니다. 첫 번째와 유사하게 생각한다면, 이 경우들은 ‘일시적으로 동일한 상태’로 볼 수 있기 때문입니다. 마지막은 빔 서치라는 기법을 활용하는 것입니다. 매 단계 높은 점수를 갖는 상태만을 남기고 다른 상태는 삭제하는 것이죠. 점수가 낮은 상태라면 최종적으로 선택될 확률이 낮으므로 이는 효율적으로 연산을 진행하는 데 효과적입니다!

③ 빔 서치 기법

   (출처 LinearFold: linear-time approximate RNA folding by 5′-to-3′ dynamic programming and beam search)

결론적으로 이런 아이디어를 모두 적용해 개발된 LinearFold는 SARS-CoV-2의 유전자 구조를 분석하는 데 걸리는 시간을 55분에서 27초로 120배 압축하는 성과를 나타냈다고 합니다. 이는 바이러스의 RNA 2차 구조의 예측 시간을 크게 단축해 백신 개발의 속도를 높이고, 연구원에게 위기 상황에서 바이러스를 더 잘 이해하고 표적 백신을 개발할 기회를 제공할 것이라 기대해 볼 수 있겠습니다.

이번 기획특집에서는 SARS-CoV-2와 백신 개발의 과정과 어려움, 그리고 그 어려움을 극복하기 위한 노력까지 알아보았습니다. 이 사태를 해결하기 위해서 다양한 분야의 연구가 진행되고 있고 많은 사람이 힘쓰고 있는 만큼 하루빨리 좋은 소식이 들려오기를 기대하면서 글을 마치도록 하겠습니다.

출처

1 http://www.docuhut.com/10%EA%B0%95-%EB%89%B4%ED%81%B4%EB%A0%88%EC%98%A4%ED%83%80%EC%9D%B4%EB%93%9C-%EB%B6%84%EC%84%9D/

2 http://dongascience.donga.com/news.php?idx=7212

3 http://blog.naver.com/PostView.nhn?blogId=ling1134&logNo=70164101856&beginTime=0&jumpingVid=&from=search&redirect=Log&widgetTypeCall=true

4 http://blog.naver.com/PostView.nhn?blogId=ling1134&logNo=70164101856&beginTime=0&jumpingVid=&from=search&redirect=Log&widgetTypeCall=true

5 https://news.joins.com/article/23727121

알리미 25기 무은재학부 19학번 원지윤