RNA 스플라이싱 예측부터 변이 분석까지…기초과학과 희귀질환 연구에 ‘게임체인저’ 기대
글로벌 AI 선두주자 구글 딥마인드가 26일(현지시간), 차세대 유전체 분석 AI 모델 ‘알파지놈’을 공식 블로그를 통해 공개했다. 해당 모델은 DNA 서열 100만 염기를 한 번에 분석할 수 있으며, 유전자의 작동 시점과 위치, 강도 등을 포함한 조절 정보까지 정밀하게 예측할 수 있는 것이 특징이다.
딥마인드는 알파지놈을 연구용 API 형태로 비상업적 사용자에게 공개했으며, 이는 기존의 DNA 분석 모델들이 가진 해상도와 속도 한계를 뛰어넘는 접근이다.
핵심 기술은 트랜스포머·컨볼루션 하이브리드 구조
알파지놈은 컨볼루션 신경망과 트랜스포머를 결합한 구조를 바탕으로, 긴 유전체 내 멀리 떨어진 염기쌍 간의 상호작용까지 예측할 수 있도록 설계됐다. 이를 통해 유전자 조절 영역뿐 아니라 변이 유무에 따른 기능 변화까지 1초 내 분석이 가능하다.
RNA 전사체에서 중요한 역할을 하는 스플라이싱 지점을 직접 예측하는 기능도 탑재되어 있어, 스플라이싱 오류로 인해 발생하는 희귀 유전 질환 연구에 효과적으로 활용될 전망이다.
‘엔포머’ 계보 잇는 알파지놈…22개 예측 과제 중 22개 1위
딥마인드에 따르면 알파지놈은 총 24개 유전체 예측 과제 중 22개에서 기존 최고 모델을 앞서는 성능을 기록했다. 특히 유전자 조절 효과 예측에서는 26개 세부 과제 중 24개에서 최상위 정확도를 달성했다.
알파지놈은 기존 유전체 예측 AI 모델인 ‘엔포머’의 아키텍처를 기반으로 개발되었으며, 딥마인드가 앞서 발표한 변이 예측 특화 모델 ‘알파미스센스’와의 병행 사용도 가능하다. 이를 통해 전체 유전체 중 98%를 차지하는 비코딩 영역까지 포괄적으로 분석할 수 있게 됐다.
방대한 공공 유전체 데이터로 학습
알파지놈 학습에는 ENCODE, GTEx, FANTOM5 등 대규모 공공 유전체 데이터셋이 활용되었으며, 사람과 생쥐의 조직 및 세포 수준 데이터도 포함됐다. 이는 모델의 예측 신뢰도를 높이고, 다양한 생물학적 조건에서도 강건한 성능을 발휘하게 한다.
전문가들 “기초과학·신약 개발 판도 바뀔 것”
유전체 분석 AI는 최근 신약 개발, 유전자 치료, 희귀질환 조기 진단 등의 분야에서 핵심 인프라로 주목받고 있다. 알파지놈은 이전보다 훨씬 빠르고 정밀한 예측이 가능해, 기초과학과 바이오메디컬 산업 전반의 기술 패러다임 전환을 이끌 수 있다는 평가다.
딥마인드 공동 창업자 겸 CEO 데미스 하사비스는 “알파지놈은 유전자 기능의 정밀한 이해를 가속화하고, 희귀 및 복합 질환의 원인을 밝히는 데 강력한 도구가 될 것”이라고 말했다.
신주백 기자 jbshin@kmjournal.net