콘텐츠로 이동

AI 기반 신약 개발: 입체 화학적 정보 활용 딥러닝 모델의 혁신

원제목: Applications of equivariant and invariant molecular representations for deep learning indrug discovery

핵심 요약

  • AI가 신약 개발의 속도와 정확성을 획기적으로 높이고 있음을 보여줌.
  • 입체 화학적 정보(Equivariant/Invariant)를 활용한 딥러닝 모델이 신약 후보물질 발굴에 핵심적인 역할을 함.
  • 단백질-소분자 결합 예측, 수화 부위 예측 등 구체적인 신약 개발 단계에 AI 모델이 적용되고 있음.

상세 내용

최근 몇 년간 인공지능(AI)의 발전으로 컴퓨터 기반 신약 개발 분야는 눈부신 발전을 거듭하고 있습니다. 특히 AlphaFold2와 AlphaFold3와 같은 딥러닝 모델의 획기적인 성공은 실험 및 시뮬레이션 기반 방법론을 보완하고 강화함으로써 생물학 분야의 과학적 발전을 가속화할 수 있음을 입증했습니다. 단백질 구조 예측을 넘어서, 신약 후보물질 발굴의 핵심 과정 중 하나는 소분자가 단백질에 결합하는 방식을 이해하는 것입니다. 이를 위해 기계 학습 모델에 입력될 소분자와 단백질에 대한 적절한 표현 방식과 특정 모델 아키텍처의 설계는 관련 특성 예측의 성공에 필수적입니다. 과학적 질문과 맥락에 따라, 불변(invariant) 및 등변(equivariant) 모델이 일반적으로 활용됩니다. 본 논문에서는 소분자 및 단백질과 관련된 여러 목표 변수를 예측하기 위해 등변 및 불변 모델을 모두 적용하여 신약 개발 파이프라인을 개선하고자 합니다.

리간드와 표적 단백질 간의 결합 강도는 3차원 공간에서의 두 개체가 겪는 물리화학적 상호작용에 의해 결정되며, 이는 리간드와 단백질 모두의 퍼텐셜 필드에 의해 지배됩니다. 분자 상호작용 필드의 유용한 근사치는 극값, 즉 필드 포인트(field points)로 제공됩니다. 본 논문의 첫 번째 기여는 소분자의 필드 포인트 예측을 위해 훈련된 번역 및 회전 등변 모델입니다. 물리화학적 필드 포인트 예측을 위한 빠르고 신경망 기반의 접근 방식은 향후 대규모 화합물 데이터베이스에 대한 유사성 기반 가상 스크리닝 연구에 활용될 수 있습니다. 단백질-리간드 결합 및 단백질 접힘에 영향을 미치는 또 다른 필수적인 요소는 용매의 영향입니다. 수화 부위 위치와 관련 열역학적 속성을 정확하게 식별하는 것은 탈용매화 자유 에너지 계산을 가능하게 합니다. 분자 역학 시뮬레이션은 이러한 단백질-물 상호작용 패턴을 포착하는 비교적 정확하지만 계산 비용이 많이 드는 방법을 제공합니다.

본 논문에서 제시된 두 번째 연구에서는 분자 역학 데이터에 대해 등변 신경망을 훈련하여 수화 부위를 예측하고, 불변 네트워크를 사용하여 관련 열역학적 속성을 예측합니다. 이러한 예측은 단백질체학, 표적 식별 및 가상 스크리닝을 위한 도구에 통합될 수 있습니다. 3D 좌표에서 작동하는 등변 네트워크 외에도, 분자의 내부 좌표 표현에 기반한 불변 네트워크는 다양한 예측 작업에 널리 사용됩니다. 분자의 구조적 유연성은 주로 비틀림 각도(torsion angles)에 의해 결정되므로, 분자 구조는 초도면체(hypertorus) 상의 점으로 표현될 수 있습니다. 초도면체 상의 분포 모델링을 위해, 유클리드 공간에서의 정규 분포에 대한 원형 유사체로 폰 미세스 분포(von Mises distribution)가 자주 사용됩니다. 보다 이론적인 연구에서는 초도면체 상의 폰 미세스 분포에 대한 대안으로 정규 분포의 역 입체 사영(inverse stereographic projection)의 특성을 연구합니다. 이는 분자 모델링 및 예측에 있어서 고급 수학적 개념의 적용 가능성을 시사합니다.


편집자 노트

본 논문은 AI, 특히 딥러닝 기술이 어떻게 신약 개발이라는 복잡하고 비용이 많이 드는 과정을 혁신하고 있는지 구체적으로 보여주는 중요한 연구입니다. 일반 대중에게는 다소 어렵게 느껴질 수 있는 '등변(equivariant)' 및 '불변(invariant)'이라는 용어가 핵심인데, 이는 AI 모델이 분자의 3차원 구조적 특성, 즉 회전하거나 이동해도 변하지 않는 본질적인 특징이나, 이러한 변화에 따라 예측값이 달라지는 특성을 얼마나 잘 이해하고 활용하는지를 의미합니다. 이는 단순히 데이터 패턴을 인식하는 것을 넘어, 실제 물리화학적 원리에 기반한 예측을 가능하게 하여 신약 개발의 정확성을 높이는 데 결정적인 역할을 합니다.

AI가 신약 개발에 활용되는 이유는 단순히 속도뿐만 아니라, 기존에는 탐색하기 어려웠던 방대한 후보물질들을 효율적으로 스크리닝하고, 특정 단백질에 얼마나 잘 결합할지를 예측함으로써 실패 확률을 줄이기 때문입니다. 예를 들어, 본 논문에서 언급된 '필드 포인트' 예측은 특정 분자가 표적 단백질과 상호작용할 때 어떤 지점에서 가장 강한 영향을 미치는지 예측하는 것으로, 이는 마치 자석의 극을 파악하는 것과 유사합니다. 또한, '수화 부위' 예측은 약물이 우리 몸 안에서 어떻게 용해되고 작용하는지를 이해하는 데 중요한데, AI는 이러한 복잡한 과정을 시뮬레이션하는 시간을 크게 단축시켜 줍니다. 이러한 기술의 발전은 우리가 앞으로 더 빠르고 효과적인 신약을 접할 수 있게 될 가능성을 높이며, 궁극적으로 질병 치료와 건강 증진에 크게 기여할 것입니다. 이는 질병으로 고통받는 환자들에게는 희망적인 소식이며, 의학 발전의 새로운 지평을 열어줄 것입니다.



원문 링크