본문 바로가기
AI와 화학물질

AI 기반 독성 예측 모델과 인실리코(in silico) 시뮬레이션의 차이점?

by Good.PhD 2025. 5. 7.

인실리코(in silico)의 뜻.

in silico는 실리콘 (silicon) 칩 위에서 수행되는 모든 종류의 실험을 의미합니다. 여기서 실리콘 칩은 컴퓨터 칩을 의미합니다. 그래서 in silico 방법은 컴퓨터에서 진행되는 실험을 의미합니다. 대규모 데이터를 컴퓨터에서 분석하는 생명정보학도 in silico 방법에 포함되고, 분자 구조의 활성을 예측하는 AI 모델도 모두 in silico 방법이라고 할 수 있습니다. in silico는 모든 종류의 정보학 (informatics) 기술을 포괄하는 개념입니다. 참고로 학술지에서는 in silico를 표기할 때 항상 이탤릭체로 표기합니다.

분자 도킹 (molecular docking), 분자 동역학 (molecular dynamics), 양자 계산 (quantum mechanics), QSAR (Quantitative Structure-Activity Relationship), 딥러닝 (deep learning), PBPK (Physiologically-based Pharmacokinetic modeling) 모델링 모두 인실리코 방법에 속합니다. 신약 개발 분야에서 이러한 계산 기반의 기술을 통칭하기 위해 인실리코라는 용어를 많이 사용합니다. 그러다 보니 신약개발 분야 특이적인 모델링을 인실리코라고 생각하는 경우도 있지만, 인실리코의 본래 정의는 컴퓨터 상에서 진행되는 모든 종류의 모델, 시뮬레이션 등을 포괄하는 개념입니다.

 

인실리코 시뮬레이션?

인실리코 방법을 이야기할 때, 인실리코 모델이라는 표현을 사용하기도 하고 인실리코 시뮬레이션이라는 용어를 사용하기도 합니다. 수행하는 인실리코 작업의 성격에 따라서 서로 다른 용어를 붙여서 쓸 수 있습니다.

예를 들어 분자 구조의 독성을 예측하는 QSAR 모델을 사용하는 경우 인실리코 모델이라고 명명합니다. PBPK의 경우는 인실리코 시뮬레이션이라는 표현을 사용합니다. 많은 경우 시뮬레이션은 시간 경과에 따른 변화를 계산하는 기술을 의미합니다. PBPK는 체내에서 약의 변화를 미분방정식으로 기술하여 시간에 따른 혈중 약물 농도 변화를 계산하는 기술입니다. 이런 기술은 인실리코 시뮬레이션이라고 부를 수 있습니다. 분자 동역학 기술은 시간에 따른 분자 구조의 변화를 시뮬레이션하는 기술입니다. 그래서 마찬가지로 인실리코 시뮬레이션이라고 명명할 수 있습니다.

 

AI?

전문가들이 AI라는 용어를 자주 사용하는 이유는 비전문가들이 기계학습/딥러닝과 같은 단어를 낯설어하기 때문입니다. 그리고 AI라는 큰 분야 안에 기계학습이 있고, 그 하부에 딥러닝이 있기 때문에 기계학습이나 딥러닝을 AI라고 명명하는 것이 크게 틀리지는 않습니다.

AI라는 표현은 정확한 의미전달에 오해가 생길 여지가 있는데, 특히나 최근 챗GPT같은 거대언어모델 (Large Language Model, LLM) / 거대멀티모달모델 (Large Multimodal Model, LMM)과 같은 시스템을 AI라고 칭하기 때문에 혼란이 야기되는 것으로 보입니다. GPT가 등장하기 전부터 딥러닝은 주목받는 기술이었고 딥러닝을 칭할 때 AI라는 용어를 계속 써왔기 때문에 지금도 계속 AI 기반 독성 예측과 같은 표현을 쓰고 있다고 생각됩니다. ‘AI 기반 독성 예측이라는 표현 안에서 AI는 딥러닝 모델을 의미합니다. 좀 더 구체적으로 따지자면 물질의 독성을 예측하는 작업에 특화된 딥러닝 모델이라는 뜻입니다.

 

딥러닝?

인공신경망 기술의 하나입니다. 인공신경망의 구조를 줄이거나 키울 수 있는데, 기존 연구보다 훨씬 더 큰 규모의 인공신경망을 딥러닝이라고 칭합니다. 딥러닝이 잘 하는 일은 주어진 입력 정보와 최종 답안 간의 관계를 정의하는 것인데, 다양한 수학 함수를 모사할 수 있습니다. QSAR에 적용된 딥러닝을 예로 들면 물질의 분자 구조와 물질의 실험값 간에 정의하기 어려운 수학적인 관계를 모사하는 일을 하게 됩니다.

그래서 딥러닝 모델은 훈련된 데이터에 따라 다양한 일을 할 수 있게 됩니다. 분자 도킹은 원래 단백질 구조와 리간드 구조를 바탕으로 둘의 결합 에너지를 계산하는 일을 합니다. 하지만 동일한 일을 딥러닝도 할 수 있습니다. 분자 구조로부터 결합 에너지를 계산하도록 훈련을 시키면 분자 도킹이 하는 일을 그대로 모사할 수 있게 됩니다. 그래서 분자 도킹에 딥러닝을 접목한 사례도 발표되고 있습니다. 동일한 이유에서 분자 동역학에도 딥러닝이 사용되고 있습니다. 기존에 분자 동역학에 사용되던 에너지 계산 함수를 딥러닝으로 대체하게 됩니다.

지금까지 언급한 기술들을 정리하자면 아래와 같은 관계도로 정리할 수 있습니다. 인실리코가 컴퓨터 상에서 수행되는 실험이라는 뜻이기 때문에 인실리코 아래에는 다양한 기술이 혼재되어 있습니다. 그 안에 AI 기술 (딥러닝 모델)이 있고, 이 모델은 다른 인실리코 기법의 일부를 대체해서 함께 사용될 수 있습니다.

 

AI 기반 독성 예측 모델?

보통 QSAR를 의미합니다. QSAR (Quantitative Structure-Activity Relationship)의 본래 정의는 물질의 분자 구조를 이용해서 물질의 활성(실험값)을 예측하는 방법입니다. 이 모델에서는 기계학습도 사용되고, 수학적인 규칙(전문가 시스템)이 사용되기도 합니다. 기계학습 방법 중에서도 딥러닝 모델을 적용한 경우에 AI 기반 예측 모델이라는 용어를 많이 사용합니다. 기존에 기계학습을 사용하던 QSAR 모델과 구분하기 위해서 DeepQSAR라는 용어도 사용되고 있습니다.

독성도 실험으로 측정된 값이기 때문에 독성을 예측하는 QSAR모델을 딥러닝으로 개발하는 경우를 AI 기반 독성 예측 모델이라고 부릅니다. 독성 예측하는 모델을 특이적으로 QSTR (Quantitative Structure-Toxicity Relationship)이라고 부르기도 합니다. ‘AI 기반이라는 용어를 사용할 때는 기존에 많이 사용되던 기계학습보다 더 고차원적인 알고리즘인 딥러닝을 적용했다는 의미로 이해하면 됩니다.

 

인실리코 시뮬레이션과 AI 기반 독성 예측 모델의 차이?

정리하자면 AI 기반 독성 예측 모델은 독성을 예측하는 딥러닝 모델을 의미합니다. 큰 틀에서 보면 AI 기반 예측 모델은 인실리코 방법의 하부에 있는 개념입니다. 인실리코와 AI 기술은 서로 다른 개념이 아닙니다.

인실리코라는 단어 뒤에 시뮬레이션이라는 단어를 추가하면 제한적인 표현이 됩니다. 인실리코 방법 중에서도 시뮬레이션에 기반한 방법을 의미하기 때문입니다. ‘시뮬레이션모델이 서로 다른 개념이기 때문입니다. 모델은 수학적인 함수를 모사한 것을 의미하며, 시뮬레이션은 시간의 변화를 추적하는 기술이기 때문입니다.

PBPK 모델과 같은 특정 기술군을 명확하게 표기할 때는 인실리코 시뮬레이션이라고 표기하는 것이 좋으나, 컴퓨터 상에서 이루어지는 모든 방법을 포괄적으로 지칭할 때는 인실리코 기법이라고 표기하는 것이 맞습니다. 그래서 인실리코 방법AI 기반 독성 예측 모델도 포함이 됩니다.