본문 바로가기

클로드4

AI가 알려준 의약품 폐기 방법 이번에 집에서 사용기한이 지난 의약품을 무더기로 찾아냈다. 그래서 폐기를 하려고 하는데,, 사실 기존에는 일반 쓰레기로 버렸었다. 약국에서 폐기해주는 것으로 알고는 있는데, 가끔 폐의약품을 반납하면 약사님이 별로 반가워하지 않는다는 느낌을 받는다. 그리고 굳이 약을 폐기하기 위해서 약국을 찾아가는 것도 굉장히 귀찮다. 그래서 알고 있는대로 실천이 잘 되지 않았다. 미켈 보쉬 야콥슨이 쓴 '의약에서 독약으로' 라는 책에서 이러한 부작용을 몇가지 언급하고 있다. 일반쓰레기로 폐기하게 되면, 결국 폐기물이 물로 흘러들어가게 된다. 쓰레기들이 비바람을 맞고 하면서 쓰레기 내부에 있는 물질들이 흘러나오고 수생 생태계에 유출이 되는데, 이 과정에서 물고기들이 약에 노출되면서 생식능력이 떨어지게 된 사례가 나온다.약.. 2024. 9. 20.
LLM간 할루시네이션 비교 (세종대왕이 맥북프로를 던진 사건) 할루시네이션은 우리 말로 환각이라고 한다. 소위 사람들이 AI가 거짓말한다고 하는게 할루시네이션이다. 환각은 모델이 모르고 있는 정보에 대해서 물어볼때 발생하는 것 같다. deeplearning.ai에서 upstage 강의를 들어보면 pretraining 과정에서 모델이 접하지 못한 정보에 대해서는 모델이 전혀 모른다는 이야기를 한다. 그래서 모델의 지식을 개선시키려면 pretraining 과정이 필수적이라고 한다. 모델이 지식은 없지만 말은 할 줄 아니 사용자의 질문에 대해서 부정확한 답변을 그럴듯한 문장으로 만들어내는 이유는  pretraining 과정에서 제대로 학습을 못한 정보이기 때문이라고 생각한다. 개인적으로 찾은 2가지 할루시네이션을 모델 별로 비교해보는 실험을 해보려고 한다.바로! 세종대왕.. 2024. 9. 16.
프롬프트 작성 핵심 원칙 (ft. 생성AI로 인사말 써 보기!) 프롬프트는 인공지능 모델에게 입력하는 지시문을 의미한다. 그러니까 챗GPT한테 이메일 작성을 요구했다면, 그 요구 사항이 프롬프트다. 그런데 많은 경우 프롬프트를 굉장히 부실하게 작성한다. 한국사람의 프롬프트가 부실한 이유는 평소에 우리의 말에서 단어의 생략이 많기 때문이라고 생각한다. 한국어로 대화할 때 주어를 구체적으로 명시하는 경우가 많지 않고, 서로 알고 있다고 생각하는 내용들도 과감히 생략해서 이야기하는 경우가 많다. 그러다 보니 우리는 원래 쓸모없는 단어를 줄여가면서 굉장히 효율적으로 대화를 하고 있다. 하지만 그런 효율적인 문장은 좋은 프롬프트라고 보긴 어렵다. 프롬프트 작성법 혹은 프롬프트 엔지니어링이라고 검색을 해보면 많은 블로그에서 정리하고 있는 내용들을 볼 수 있다. 그러한 노하우를 .. 2024. 9. 14.
거대언어모델 (LLM) 토큰 사이즈 이슈 거대언어모델에서 입력/출력하는 토큰 개수의 한도가 정해져있다.토큰은 단어와는 조금 다른 개념이다. 단어외에도 자주 쓰이는 문법 성분을 별도로 토큰으로 표기하기도 하기 때문이다.예를 들면, Eating 이라는 단어가 있으면 eat이라는 토큰과 ing 토큰으로 나뉠 수 있다. 아래 웹사이트에 문장을 입력해보면 token 수를 계산해준다.https://llmtokencounter.com/Eating healthy food makes me healthy 라는 문장을 입력하면 36개 글자, 6개 단어, 9개 토큰으로 구성된 문장이라고 알려준다. 아래는 클로드로 테스트를 해본 내용이다. 블로그 글을 입력해서 글을 다듬어보려고 했다. 프롬프트: 블로그에 작성한 내용인데 그냥 생각나는대로 구어체로 작성했음. 가독성을 .. 2024. 8. 19.