실험은 10분의 1로? 소량 데이터로 약물 개발을 가속화하는 AI가 화학 연구를 변화시키다

실험은 10분의 1로? 소량 데이터로 약물 개발을 가속화하는 AI가 화학 연구를 변화시키다

신약 개발에 AI가 도입된다. 그렇게 들으면 많은 사람들은 단백질 구조 예측이나 신약 후보의 스크리닝을 떠올릴지도 모른다. 하지만 실제 신약 개발 현장에서 시간과 돈이 크게 소모되는 것은 "좋아 보이는 분자"를 찾은 후이다. 목표한 분자를 어떻게 효율적으로, 게다가 원하는 입체 구조로 만들 것인가. 이 지루하고 무거운 공정에 드디어 진지하게 효과를 발휘할 것 같은 AI가 등장했다. 미국 유타 대학과 UCLA 등의 연구팀이 발표한 새로운 방법은 방대한 학습 데이터를 전제로 하지 않고, 소량의 실험 데이터로부터도 다음에 시도해야 할 반응 조건을 상당히 똑똑하게 좁힐 수 있다고 한다. Phys.org가 3월 9일에 보도한 이 연구의 포인트는 AI가 화학자의 일을 대체하는 것이 아니다. 오히려 화학자가 실제로 시도해야 할 실험의 후보를 먼저 걸러주는 점에 있다.


이번 연구 주제는 비대칭 합성이라고 불리는 영역이다. 의약품의 분자에는 동일한 원자가 동일한 순서로 결합되어 있어도, 삼차원 배치만이 거울상 관계를 갖는 "오른손형"과 "왼손형" 같은 관계를 갖는 것이 있다. 이들은 겉모습은 비슷해 보여도 생체 내에서는 전혀 다른 행동을 보일 수 있다. 한쪽은 약으로 작용해도 다른 쪽은 기대한 효과를 보이지 않거나, 부작용 쪽으로 돌아설 가능성이 있다. 따라서 제약에서는 원하는 "손"의 분자를 높은 비율로 선택하여 만드는 것이 극히 중요하게 된다. Phys.org의 기사에서도 바로 이 "분자의 손잡이"를 제어하는 어려움이 신약 개발의 비용과 시간을 증가시키는 요인으로 소개되고 있다.


연구팀이 다룬 것은 니켈 촉매를 사용하는 비대칭 크로스 커플링 반응의 예측이다. 대략적으로 말하면, 여러 탄소 골격을 연결하여 더 복잡하고 가치 있는 분자로 조립하는 기술이다. 하지만 그곳에서는 금속 촉매뿐만 아니라, 촉매에 결합하여 반응의 방향이나 입체 선택성을 좌우하는 "리간드", 더 나아가 기질 쪽의 구조도 영향을 미친다. 즉, 약간의 조건을 변경하는 것만으로도 결과가 달라진다. 기존에는 그 방대한 조합을 손으로 더듬어가며 최적 조건을 찾을 수밖에 없었다. 이번 논문은 그 시행착오를 통계 모델과 기구 기술에 기반한 특징량 설계로 크게 단축하려는 것이다. Nature 게재 논문의 요지에서는 촉매나 기질이 변하면 에난티오 선택성을 결정하는 단계 자체가 변화할 수 있는 점을 포함한 기술자 생성 전략을 채택하고, 미지의 리간드나 반응 상대에도 예측을 옮길 수 있는 가능성을 제시했다고 한다.


여기서 흥미로운 점은 "AI가 대량 데이터를 먹고 강해진다"는 전형적인 도식에서 약간 벗어나 있다는 것이다. 연구팀 자체가 강조하듯이, 화학에서는 질 높은 실험 데이터를 대량으로 준비하는 것 자체가 고비용이다. 그래서 그들은 소량의 기존 데이터로부터도 반응 메커니즘에 따른 특징량을 추출하여 단순한 블랙박스가 아닌 형태로 예측에 연결했다. Nature의 논문 페이지는 이 연구에 대해 제한된 반응 예만 있는 상황에서도 기존의 반응군에서 배운 지식을 새로운 화학 공간으로 "정량적으로 옮기는" 길을 열었다고 설명하고 있다. 노트르담 대학의 C-CAS에 의한 소개에서도 기구 정보가 어느 정도 알려진 반응이라면 응용 가능하며, 촉매 탐색이나 반응 최적화에 필요한 고가의 시간 소모적인 실험을 줄일 수 있다고 위치지었다.


이 연구가 실무적으로 주목받는 것은 숫자가 구체적이기 때문이다. Phys.org에 따르면, 공저자인 Erin Bucci 씨는 기존에는 50~60개의 반응을 돌렸던 상황에서 이 도구를 사용하면 5~10개 정도로 좁힐 가능성이 있다고 말했다. 한 개당 실험에는 시약 구매비, 자작 비용, 장치 사용 시간, 분석의 수고, 실패 샘플의 폐기까지 포함된다. 그것이 10분의 1 가까이 압축된다면 연구실 수준에서도 임팩트는 크고, 제약 회사라면 더욱 그렇다. 특히 전임상이나 임상 시험용 원약 합성에서는 "문헌 반응은 있지만, 자사의 목적 화합물로 그대로 통과할지는 장담할 수 없다"는 벽에 여러 번 부딪힌다. 연구팀이 상정하는 응용처가 바로 그 "마지막 마무리"에 가까운 것은 시사적이다.


중요한 것은 이 방법이 단순한 시간 단축 도구가 아니라는 점이다. Phys.org의 기사에서는 공저자인 Abigail Doyle 씨가 이 워크플로우는 블랙박스가 아니며, 예측이 빗나갔을 때에도 화학을 배울 수 있다고 설명하고 있다. 즉, AI의 답을 그대로 믿는 것이 아니라 "왜 그 조건을 추천했는가", "왜 빗나갔는가"를 인간의 화학 지식과 대조함으로써 메커니즘 이해 자체가 깊어지는 설계가 되어 있다. AI와 화학자의 역할 분담으로 보면, 이는 상당히 건전하다. 생성 AI의 열광이 강한 국면에서는 종종 "모두 자동화할 수 있다"는 이야기가 앞서지만, 현실의 합성 화학에서는 반응이 작동할지 여부 이상으로 어떤 부반응이 일어날지, 정제가 성립할지, 스케일업 시에 재현할 수 있을지 등의 진흙탕 같은 논점이 산더미처럼 있다. 그렇기 때문에 이번 연구가 평가받는 것은 AI를 만능화하지 않고, 현장의 판단을 보강하는 도구로 만들어졌기 때문일 것이다.


SNS나 주변의 온라인 반응을 봐도 주목점은 거기에 모여 있다. X에서는 화학 뉴스 계정이 이 논문을 소개하고 있으며, 적어도 공개 검색에서 확인할 수 있는 범위에서는 화려한 일반 대중을 위한 버즈보다는 전문 커뮤니티 중심의 공유로 유통되고 있는 인상이다. Nature의 논문 페이지에서는 Altmetric이 28로 표시되어 있으며, 논문 공개 후 한동안 학술·업계 주변에서 착실히 참조된 모습이 엿보인다. 한편, 모두가 열광하고 있다기보다는 "이것은 실험 탐색을 줄이는 현실적인 보조선이다"라는 받아들임이 중심에 보인다. 공개 검색에서 확인할 수 있는 LinkedIn 게시물에서도 약제 개발이나 화학의 문맥에서 "제한된 데이터로부터 에난티오 선택성을 예측할 수 있는 점이 중요하다", "비용과 폐기를 줄일 수 있다"는 평가가 두드러졌다.


다만, SNS 반응의 양 자체는 현시점에서는 폭발적이지 않다. 여기는 냉정하게 봐야 할 것이다. 공개 검색에서 확인할 수 있는 범위에서는 일반 소비자 대상의 AI 뉴스 같은 대규모 확산은 아직 일어나지 않았다. 대신 논문 소개나 연구 커뮤니티 내에서의 공유가 먼저 진행되고 있다. 이는 뒤집어 보면 이 성과가 "헤드라인만 화려한 AI"가 아니라 실제로 손을 움직이는 연구자나 신약 개발 실무자일수록 가치를 느끼기 쉬운 유형의 기술임을 나타내는 것일지도 모른다. AI 신약 개발의 화제는 종종 "신약이 곧 발견된다"는 기대를 품기 쉽지만, 현장에 있어 절실한 것은 좋은 후보를 어떻게 재현성 높게, 빠르게, 싸게 만들 수 있는가이다. 거기에 응답하는 연구는 널리 얕게 버즈를 일으키기보다는 전문가의 눈으로 조용히 평가되는 경향이 있다.


물론 한계도 있다. 이 연구는 특정 반응군, 특히 니켈 촉매를 사용하는 비대칭 C(sp3) 커플링을 중심으로 검증되어 있으며, 모든 합성 반응에 즉시 일반화할 수 있다고까지는 말하지 않는다. Nature 논문의 요지도 메커니즘적으로 의미 있는 특징량이 얻어질 수 있는 것이 전제에 있다. 뒤집어 보면 메커니즘 이해가 얕은 반응이나 실험 조건의 변동이 큰 계에서는 같은 정밀도로 사용할 수 있다고는 할 수 없다. 그럼에도 불구하고 의의가 큰 것은 "대규모 데이터가 없으면 AI는 쓸모없다"는 반쯤 상식화된 발상에 대해 화학의 문맥에서는 다른 경로가 있음을 보여준 점이다. 즉, 데이터 양의 부족을 메커니즘 지식과 특징량 설계로 보완한다. 이는 신약 개발에 한정되지 않고, 실험 과학 전반으로 확산되는 사고방식이기도 하다.

실제로 이 연구의 범위는 제약 기업의 연구소에만 국한되지 않는다. 대학의 합성 연구실에게도 제한된 예산으로 어떤 반응을 우선할지 생사의 문제다. 시약 가격의 급등, 학생이나 연구자의 시간 제약, 안전 관리의 엄격화가 진행되는 가운데 무작정 총력전 실험은 점점 어려워지고 있다. 적은 실험으로 다음 한 수를 높은 확률로 맞추는 기술은 연구 개발의 민주화에도 연결된다. 풍부한 자금을 가진 거대 기업뿐만 아니라 중소 규모의 연구실에서도 싸울 수 있는 여지가 넓어지기 때문이다. C-CAS의 소개에서는 이 워크플로우는 공개 액세스 가능하며, 메커니즘 정보가 있는 반응에 적용할 수 있다고 한다. 여기가 앞으로 더욱 정비된다면 "경험이 풍부한 명인의 직감"에 의존했던 부분을 공유 가능한 반정량 지식으로 변화시키는 흐름이 강해질지도 모른다.


AI가 과학 연구에 들어갈 때 정말 중요한 것은 연구자의 손을 빼앗는 것이 아니라 연구자가 사용할 수 있는 시간을 되찾는 것이다. 이번 연구는 그 원칙을 상당히 성실하게 구현하고 있다. 대량 데이터를 전제로 한 화려한 만능론이 아니라 소량 데이터와 메커니즘 이해를 결합하여 다음 실험을 똑똑하게 줄인다. 다시 말해 과학자의 가설 형성과 시행착오를 현실적인 비용 범위 내에서 한 단계 앞으로 밀어내는 도구다. 신약 개발은 영감만으로도, 계산만으로도 진행되지 않는다. 마지막은 시험관 안에서 확인할 수밖에 없다. 그러나 그 "확인 방법"을 바꿀 수 있다면 약 만들기의 속도도, 실패의 질도 크게 변할 것이다. 이번 AI는 신약을 마법처럼 만들어내는 장치는 아니다. 하지만 약이 탄생하기까지의 우회로를 확실히 짧게 하는 기술로서는 상당히 진짜에 가깝다.



출처 URL

  1. Phys.org 이번 연구의 일반 대중을 위한 해설, 연구자 코멘트, 실험 수를 50~60에서 5~10으로 줄일 가능성 등의 기술을 확인한 것.
    https://phys.org/news/2026-03-ai-tool-drug-synthesis-lab.html

  2. Nature 게재의 원 논문 페이지. 논문 제목, 저자, 공개일, 요지, 연구의 기술적 위치, Altmetric 값을 확인한 것.
    https://www.nature.com/articles/s41586-026-10239-7

  3. DOI 페이지. 원 논문의 정식 식별자를 나타내는 참조처.
    https://doi.org/10.1038/s41586-026-10239-7

  4. University of Notre Dame / NSF Center for Computer Assisted Synthesis의 소개 기사. 연구의 배경, 소량 데이터, 메커니즘에 기반한 특징량, 미지 반응에의 전이 가능성, 공개 액세스 가능한 워크플로우라는 설명을 확인한 것.
    https://ccas.nd.edu/news-events/news/accelerated-article-preview-from-doyle-and-sigman-labs-published-by-nature/

  5. X 상의 Chemistry News에 의한 논문 소개 게시물. 공개 범위에서 확인할 수 있는 SNS 공유의 한 예.
    https://x.com/ChemistryNews/status/2021718428965646726

  6. LinkedIn 상의 Joel Walker 씨의 게시물. 전문 커뮤니티 측에서의 공유 예로 확인한 것.
    https://www.linkedin.com/posts/joel-walker-23764715_transferable-enantioselectivity-models-from-activity-7428082839583313920-Gan6

  7. LinkedIn 상의 INFO FIELDS 게시물. 소량 데이터로부터의 예측이나 신약 개발·합성 효율화에 대한 기대가 나타난 공유 예로 참조한 것.
    https://www.linkedin.com/posts/info-fields_transferable-enantioselectivity-models-from-activity-7427386888996597760-S51-