어렸을 때는 마약 문제는 해외에서나 일어나는 일인줄 알았는데... 요즘엔 국내에도 심각한가보다. 주변에서 그런 사건을 직접 본 적은 없지만, 종종 뉴스나 광고에서 보게 된다. 심각성이 피부로 와닿는 정도는 아니지만, 예전보다는 심각하다는 느낌은 받는다. 그래서 한번 마약의 독성을 예측해보기로 했다. 우선 들어본적 있는 대마 (마리화나). 대마 성분 중 테트라히드로칸나비놀(THC)와 칸나비놀 (Cannabinol)의 독성을 VEGA로 예측해서 비교해보기로 했다. 실제 환각을 유발하는 것은 THC라고 한다. 대마에 대해서 검색해보니... 사실 사용처가 굉장히 다양하다. 수면보조제, 통증완화제, 식욕자극제. 음식으로 먹는 경우도 있다고 한다. 먹어본적이 없어서 잘 모르겠다. Coursera에서도 cannabis로 검색하면 다양한 강의들이 있다. 의료용으로 사용되는 경우에 대한 수업인 것 같다.
smiles 코드는 PubChem에서 찾았다. 먼저 칸나비놀부터 예측을 해봤다.
VEGA에서 예측할 수 있는 모든 예측모델을 이용해서 전부 계산해봤다. 모델이 63개라고 한다. 63개의 값을 일일히 보고서를 볼 수 는 없으니 Summary만 보기로 했다. 그러면 csv 파일 하나에 모든 결과 값이 저장된다.
Summary 파일에는 적용범위 분석에 대한 정확한 내용은 없다. 하지만 4가지 카테고리로 나뉜다.
Experiment: 데이터에 실험값이 있음. (예측 값보다 실험값이 더 신뢰할 수 있는 정보다. 그러니 믿을 수 있는 정보)
Good: 적용범위에 잘 맞는 경우. (예측 값이 정확할 가능성이 아주 높음)
Moderate: 예측 신뢰도 보통. 값이 정확할지 어떨지 잘 모르겠음.
LOW: 예측 신뢰도 낮음. 예측 값을 믿지 말 것.
이 중에서 믿을만한 결과는 Experiment와 Good 뿐이다. 칸나비놀에 대해서 예측한 값중 Experiment와 Good이 나온 모델의 결과를 찾아봤다.
실험 결과가 있는 경우는 아래 2가지 경우다. (Experiment)
1. 발암성 (암컷 쥐) TD50: 243.22 mg/kg
2. 유전독성: 독성 O
예측 결과지만 신뢰도가 높은 경우는 아래 5가지다. (Good)
1. 생식발생독성: 독성 O
2. 발암성: 독성 X
3. 급성독성: 2306 mg/kg
4. 갑상선: 독성 X
5. 지방간: 독성 X
발암성 (암컷 쥐) TD50 값은 해석이 어렵다. 동물 실험은 여러마리의 동물을 대상으로 진행된다. TD50에서 50은 50%를 의미한다. 실험된 동물 중 50%에서 암이 발생했을 때의 농도를 TD50이라고 한다. 검색해보니 소매용 대마초에는 THC가 10mg 정도 들어 있다고 한다. 대마 안에서 칸나비놀은 양이 훨씬 적다고 한다. 그러면 발암성은 거의 없다고 봐야 겠다. 하지만 유전 독성에서 문제가 있는 것으로 나왔다. 유전독성 결과는 소핵실험 (in vivo micronucleus) 결과이다. 세포 안에는 핵이 있다. 이 핵이 조각난 것을 소핵이라고 부른다. 핵이 조각 나버린 것은 유전 정보에 어떻게든 악영향을 미쳤다는 의미이다. 유전자는 DNA안에 들어있다. 그리고 DNA는 세포핵 내에서 잘 포장되어서 염색체 형태로 존재한다. 핵이 조각 났다는 의미는 염색체에 문제가 생겼다는 뜻이다. 그래서 예측 결과에 따르면 칸나비놀이 유전자에 손상을 입힌다는 뜻이 된다. 암 발생에는 여러가지 원인이 있지만 유전자의 손상도 원인 중 하나가 된다.
두번째로 확인된 독성은 발생독성이다. 발생 독성은 기형아가 생길 가능성을 의미한다. 태아가 엄마 뱃속에서 팔다리도 생기고 다양한 장기가 형성되는데, 이때 악영향을 미치는 물질을 발생독성물질이라고 한다. 예측 결과대로면 칸나비놀은 발생독성을 일으킬 가능성이 있다. 칸나비놀과 유사한 물질들이 발생독성을 일으킨 경우가 많았던 것으로 생각된다. 발생독성 모델의 QMRF 문서를 보니 사람과 동물 데이터로 모델을 개발했다. 사람에서의 독성 값도 데이터에 포함되어 있다고 하니 사람에게서 나타날 수 있는 독성과 연관성이 높은 정보라고 본다.
급성독성은 짧은 시간에 다량을 섭취했을 때 나타나는 독성을 의미한다. 급성독성 값은 꽤 높은 값이 나왔다. 그래서 아마도 사람에게서 급성독성이 나타나긴 어려워보인다.
그러면 THC는?
구조는 칸나비놀과 거의 동일하다. 다른 부분만 빨간색 원으로 표기했다. 이 정도로 유사하면 예측 값은 대략 비슷하지 않을까 생각을 했는데, 일단 실험값이 많이 확인되었다. 예측값에서도 Good으로 평가된 데이터가 여러건 있었다.
Experimental value
1. 유전독성: 독성O
2. 발암성: 독성X
3. NOAEL: 단위가 불명확... (5mg/kg 아니면 1572mg/kg이다. 이렇게 차이가 나는 이유는? 예측 report에서는 단위를 mg/kg으로 보고했는데, QMRF는 mmol/kg이라고 했다. 누구를 믿어야 할지... 알수가 없다)
4. Plasma protein binding (PPB, 혈장 단백질 결합): 1.279
5. Aromatase: active antagonist
Good
1. 유전독성: 독성 X
2. 발생독성: 독성 O
3. 에스트로겐: Active
4. 갑상선: Inactive
5. 반감기: 9.86 시간
6. 지방간: 주의
둘을 비교하면 동일하게 나온 값은 아래와 같다.
소핵실험 실험 값은 THC와 칸나비놀 둘다 동일하게 독성이 있는 것으로 확인되었다.
발생독성도 둘 다 독성이 있는 것으로 확인되었다.
THC에서는 훨씬 많은 모델에서 실험값과 믿을만한 예측값을 제공했다.
Plasma protein binding은 혈액속에 있는 단백질과 결합한다는 의미다. 약어로 PPB라고 하는데, 물질이 어렵게 어렵게 흡수가 되더라도 혈액에서 다른 단백질들과 결합해버리면 아무것도 못하고 다시 배출된다. 그래서 PPB가 높다면 별로 영향을 나타내지 못할 가능성이 높다. PPB가 0이면 단백질과 결합한 물질: 결합하지 않은 물질 비율이 1:1이라는 의미다. 0보다 커지면 단백질과 결합한 경우가 더 많다는 것인데, THC의 경우 단백질에 더 많이 결합하는 것으로 보인다. 예측 값 중에서는 반감기가 9.86 시간으로 예측되었다. THC가 흡수된 후 10시간 정도 지나면 체내에서 절반만 남아있다는 이야기다. 체내에서 오래 남아있지는 않는 것 같다.
예전에도 언급했다시피 독성은 농도가 중요하다. 예측 모델 중에서 독성이 있다 없다 이렇게 단순하게 분류한 경우가 있다. 이 경우 아쉬운 점은 실제 어떤 농도에서 독성이 확인된것인지 한참 알아봐야 예측 결과에 대한 해석이 가능하다는 것이다. 데이터 출처가 언급은 되어있지만, 어떤 근거로 독성이 있는 것과 없는 것으로 나누었는지에 대한 조건이 명시되어 있지 않다. 그래서 예측 결과만 봐서는 달리 할말이 없다. 독성을 확인한다는 것이 단순한 문제가 아니고 이렇게 여러가지 정보들을 종합해서 평가를 하게 된다. 마약에 대해 전문지식이 있는 분이 프로그램을 사용하신다면 더 효과적으로 사용할 수 있을 것 같다. 앞으로 관심있는 물질들은 이렇게 한번씩 예측을 해보고 결과를 한번 정리해보면 좋을듯..
'AI와 화학물질' 카테고리의 다른 글
돈 잘 벌고 있는 독성 예측 서비스 5가지 (딥러닝 없어도 정확해요) (3) | 2024.11.27 |
---|---|
알파폴드 이보다 단순하게 설명할 순 없다 (2) | 2024.11.25 |
노벨화학상 받은 AI? 잘 사용하지 않는 이유... (1) | 2024.11.23 |
AI는 어떻게 악용될 수 있을까? (1) | 2024.11.22 |
속내를 알 수 없는 AI (0) | 2024.11.21 |