본문 바로가기
AI와 화학물질

화학물질이 안전한지 알려주는 무료 AI 프로그램

by Good.PhD 2024. 11. 13.

AI 기술을 도입한 기술들이 굉장히 많아졌다. 화학물질이 안전한지 알려주는 프로그램도 많다. 심지어 무료도 많다. 다만 사용이 쉽지는 않다. 아무튼 무료는 무료. 사용은 해볼 수 있으니,, 한번 소개해본다.

 

오늘 소개할 프로그램 이름은 VEGA. 구글에 검색할 때는 vega qsar라고 입력해야 제대로된 정보를 찾을 수 있다.

VEGA QSAR – VEGA HUB

 

VEGA QSAR

 

www.vegahub.eu

 

화학물질의 구조만 보고 실험값을 알려주는 AI 모델들을 QSAR라고 부른다. QSAR는 Quantitative Structure-Activity Relationship 이라는 긴긴 단어의 약어다. 큐사라고 읽거나 아니면 그냥 알파벳 각각을 읽어서 큐에스에이알 이라고 읽는다.

 

아래와 같이 구조가 AI 모델에 입력되면, 구조로부터 실험값을 추론해준다. 이렇게 작동해서 QSAR라고 부른다. 

Structure (화학물질의 구조) >> Relationship (AI 기술) >> Activity (화학물질의 실험 값)

참고로 Quantitative는 정량적이라는 뜻인데 아주아주 단순화하면 결과값이 숫자로 나온다는 뜻이다. 실험값 들을 숫자로 표기하는 경우가 많고, 그 실험 값을 계산하도록 모델이 만들어져 있기 때문이다.

 

QSAR 모델은 1950년대에 등장한 기술이다. 처음에는 단순한 통계 기법인 선형 회귀 모델로 개발이 되었다. 기계학습 기술이 발전을 하면서 QSAR에도 좀 더 복잡한 알고리즘들이 적용되기 시작했다. 하지만 가장 큰 문제는 모델의 추론값이 큰 오차를 발생시켰다는 것. 실험값과 비교해보면 얼토당토 않은 값들이 나오는 경우가 많았다. 큰 기대를 모았었지만, 막상 실전에서 효과가 별로 없다보니 QSAR라는 기술을 크게 불신하는 사람들이 많아졌다.

개인적으로 대학원 과정을 할 때도 QSAR 모델로 논문의 방향을 잡았었다. 졸업하려면 논문을 학술지에 투고해야 하는데, 학술지 중에서 QSAR 연구는 받지 않겠다는 곳이 늘어나는 추세기도 했다. 그래서 암울했던 기억도 난다. 그리고 다른 교수님들하고 회의하면서 개발하고 있는 기술을 소개했다가 무시 당한 것도 한두번이 아니다. 그렇게 우울한 시기가 있었는데, 학위 받기 1년 전 딥러닝이 등장했다. 그리고 QSAR에도 딥러닝을 사용하기 시작했다. 다시 주목을 받긴 했지만, 논문에서 이제 QSAR라는 단어는 잘 사용하지 않는다. 대신 기계학습 모델 / 딥러닝 모델 이라는 표현을 더 선호한다. 그래서 QSAR라는 용어 자체는 많이 사용하지 않지만, 여전히 다양하게 사용되고 있는 기술이다. QSAR라는 표현이 너무 어렵기도 하고 기술의 핵심에 AI 모델이 있기 때문에 나도 그냥 AI 모델이라고 통칭해서 부른다. 화학물질의 구조로 안전성을 추론해주는 AI 모델. 이렇게 길게 적는 것보다 QSAR라고 적는게 쉽긴 하지만 단어가 갖고 있는 이미지가 부정적이 되어서 잘 사용하지 않는다. 기술적으로는 동일한데 표현이 바뀌었다고 다른 대접을 받는 것을 보면 약간 씁쓸하기도 하다. 본질은 동일한데...

 

QSAR는 제약업계에서 신약 개발에 가장 활발하게 사용되었다. 신약 개발의 비효율성을 줄여주기 위해 적극적으로 도입하게 되었다. 신약 개발 분야에서 사용되는 사례는 안될과학에서 한번 다룬적이 있다. 아래 링크를 참고하시길...

https://youtu.be/Q7hYNdnL8wg?si=sh_wObAAygBr7kmz

https://youtu.be/_IJ3AaVBWwI?si=h_5BBkq9KsIzFan2

 

신약 개발에 가장 많이 사용되었지만, 화학 산업 전반에서 다 활용될 수 있는 기술이다. 농약 개발에서도 사용되고 있고, 화장품이나 향수 개발에도 활용될 수 있다. 다만 신약 개발에서 가장 많은 모델이 연구되었는데, 이는 시중에서 구할 수 있는데이터가 훨씬 많기 때문이다. 

 

VEGA라는 소프트웨어는 이탈리아 IRFMN (Istituto di Ricerche Farmacologiche Mario Negri) 이라는 연구소에서 개발한 프로그램이다. 이름이 이탈리아어로 되어 있는데 약에 대해서 연구하는 곳이다. Mario Negri는 사람이름인데 연구소 이름에 사람 이름이 들어 있어서 특이하다고 생각했다. 사석에서 IFRMN이 어떻게 시작되었는지 얼핏 들었다. IRFMN의 초대 소장님이 되신 분께서 어떤 행사에 참여해서 자기 옆자리에 있던 어떤 분에게 자신의 연구 비전에 대해서 열심히 소개를 했다고 한다. 몇달 후에 연락을 받게 되었는데, Mario Negri 라는 분이 돌아가시면서 당신에게 유산을 남겼다고 전했다. '당신이 그때 설명했던 그 연구를 하는데 이 돈을 사용해주시오.'라는 유언도 함께 전달했다. 그 자금으로 IRFMN이라는 연구소가 시작되었다고 한다. 이 연구소에서 개발한 VEGA 라는 프로그램도 굉장히 훌륭한 프로그램이다. Mario Negri라는 부자의 유산에 대한 혜택을 내가 지금 누리고 있다니... 감격스러운 일이다.

 

VEGA는 그냥 다운받아서 PC에서 사용하는 프로그램이다. 인터넷이 연결되지 않은 환경에서도 사용가능하다. 그래서 보안문제는 걱절할 필요가 없다. 새로운 물질을 개발하는 곳은 특허를 통해 연구성과물을 보호하고, 이를 바탕으로 연구개발 (Research & Development, R&D) 비용을 회수할 수 있다. 그렇기 때문에 물질의 정보가 외부로 유출되는 것에 극도로 민감한 반응을 보인다. VEGA는 마음 편하게 사용할 수 있는 프로그램이니 그런 걱정은 안 해도 된다. VEGA 다운로드 페이지에서 직접 파일을 다운 받아서 사용하게 되어 있다

VEGA 다운로드 페이지

 

 zip파일을 다운받게 되는데 그냥 압축풀고 바로 실행하면 된다.Window용 실행파일 이름은 Vega-launcher-WIN.bat이다. 리눅스나 맥을 사용한다면 Vega-launcher-LINUX.sh를 사용하면 된다. 맥은 실행하려면 세팅이 필요한 것 같긴 하다. 실제 실행프로그램은 Vega-GUI-1.2.4.jar 파일이다. 그래서 java를 이용해서 jar 파일만 실행시키면 문제 없다.

 

VEGA에서 다운받은 파일 압출을 풀면..!

 

다른 운영체제는 잘 모르겠지만 윈도우에서는 처음 실행하면 경고 창이 보인다. 처음에는 '실행 안 함' 버튼만 보이는게 문제다. '이 앱을 실행하면 PC가 위험에 노출될 수 있습니다.'라는 문구 밑에 다른 문구가 보이는데 그 부분을 클릭해주면 '실행'버튼이 생겨난다. 그러면 '실행'버튼을 눌러주면 된다. 한번 하고 나면 다시 안 물어본다.

뜬근없는 보호 기능

 

실행을 하고 나면 프로그램 초기 화면이 보인다. 첫 화면에서 물질 구조를 입력하는 부분이 보인다. 확인해보고 싶은 물질들의 구조를 입력해주는 것이 첫 단계. 구조 파일을 준비하는 부분은 다음 글에 이어서 소개해보겠다.

VEGA 실행화면