본문 바로가기

생성AI11

인공지능도 사투리를 알아들을까? 인공지능이 환각 형상을 많이 일으키는 경우 중 하나가 우리나라 사투리였다. 사투리를 못 알아듣는 문제가 있었는데, 오늘 다시 테스트해보니 성능이 상당히 개선된 것을 볼 수 있었다. 모델 별로 한번 테스트를 해봤는데, 테스트에 사용한 표현은 두가지다.  프롬프트 1:. 갸가 갸냐? 이거 무슨 뜻이야?프롬프트 2: '멍 때린다' 이거 무슨 뜻이야? 첫번째는 사투리, 두번째는 자주 쓰는 한국적인 표현. 각 표현이 무슨 뜻인지 모르면 모델이 이상한 헛소리를 한다. 작년에 학회에서 chatGPT 할루시네이션으로 두번째 프롬프트를 사용했었는데, 멍 때린다에서 '멍'을 상처나서 멍든 것으로 이해해서, 멍든 곳을 다시 때리며 안된다는 답변을 한 사례가 소개된 적이 있었다. 과연 해당 표현에 대해서 지금은 어떻게 답변이.. 2024. 10. 1.
비디오 생성 AI를 사용해보고 나서... 이미지 생성 모델은 자주 사용하는 편이지만, 영상은 만들 일이 없어서 거의 사용하지는 않았다. 예전에 한번 사용했을 때 그렇게 성능이 좋지 않기도 했다. OpenAI에서 SORA를 공개하면서 큰 기대를 모으기도 했고, 최근에는 얼마나 바뀌었을지 궁금해서 한번 테스트를 해보기로 했다. 밑에서 생성된 영상 퀄리티를 보면 알 수 있겠지만, 영상 생성은 아직 갈 길이 먼것 같다. 사실상 가장 마지막에 소개하는 영상 편집 툴이 가장 쓸모 있는 것 같다. 테스트를 하려니 뭘 만들어야 될지 몰라서 고민하느라 시간을 많이 보냈다. 관심없는 일 하는 걸 상당히 어려워하는 편이다. 그래도 동영상 만드는 것도 소개했으면 좋겠다는 의견이 있어서 사용가능한 툴을 소개할 겸 간단하게 글을 작성해보게 되었다. 머리를 쥐어짜낸 끝에.. 2024. 9. 30.
AI가 알려준 의약품 폐기 방법 이번에 집에서 사용기한이 지난 의약품을 무더기로 찾아냈다. 그래서 폐기를 하려고 하는데,, 사실 기존에는 일반 쓰레기로 버렸었다. 약국에서 폐기해주는 것으로 알고는 있는데, 가끔 폐의약품을 반납하면 약사님이 별로 반가워하지 않는다는 느낌을 받는다. 그리고 굳이 약을 폐기하기 위해서 약국을 찾아가는 것도 굉장히 귀찮다. 그래서 알고 있는대로 실천이 잘 되지 않았다. 미켈 보쉬 야콥슨이 쓴 '의약에서 독약으로' 라는 책에서 이러한 부작용을 몇가지 언급하고 있다. 일반쓰레기로 폐기하게 되면, 결국 폐기물이 물로 흘러들어가게 된다. 쓰레기들이 비바람을 맞고 하면서 쓰레기 내부에 있는 물질들이 흘러나오고 수생 생태계에 유출이 되는데, 이 과정에서 물고기들이 약에 노출되면서 생식능력이 떨어지게 된 사례가 나온다.약.. 2024. 9. 20.
헤엄치는 연어회 실험 (이미지 생성AI 환각 테스트) 이미지 생성AI도 환각 이슈가 있다. 대표적인 사례가 이 헤엄치는 연어회 이미지다. 예전에 검색해본 결과에 따르면 일본에서 연어를 그려달라는 프롬프트를 입력했고 그 결과로 이렇게 헤엄치는 연어회 이미지가 얻어졌다고 한다. 과연 이렇게 환각이 발생하는 모델이 있을지 궁금해서 테스트를 해보았다. 이미지 생성모델은 아래와 같이 사용해보았다.1. DALL-E: 코파일럿과 뤼튼에서 제공하는 생성이미지는 DALL-E가 생성해준 이미지다.2. lasco.ai3. ideogram4. stable diffusion5. flux6. adobe firefly 프롬프트를 뭘로 할까 하다가... 연어를 그려달라고 요청해봤다. 강에서 헤엄치는 연어를 그려달라고도 해봤는데 결과는 비슷했다. 그래서 예전같은 할루시네이션은 이제 거의.. 2024. 9. 18.
LLM간 할루시네이션 비교 (세종대왕이 맥북프로를 던진 사건) 할루시네이션은 우리 말로 환각이라고 한다. 소위 사람들이 AI가 거짓말한다고 하는게 할루시네이션이다. 환각은 모델이 모르고 있는 정보에 대해서 물어볼때 발생하는 것 같다. deeplearning.ai에서 upstage 강의를 들어보면 pretraining 과정에서 모델이 접하지 못한 정보에 대해서는 모델이 전혀 모른다는 이야기를 한다. 그래서 모델의 지식을 개선시키려면 pretraining 과정이 필수적이라고 한다. 모델이 지식은 없지만 말은 할 줄 아니 사용자의 질문에 대해서 부정확한 답변을 그럴듯한 문장으로 만들어내는 이유는  pretraining 과정에서 제대로 학습을 못한 정보이기 때문이라고 생각한다. 개인적으로 찾은 2가지 할루시네이션을 모델 별로 비교해보는 실험을 해보려고 한다.바로! 세종대왕.. 2024. 9. 16.
프롬프트 작성 핵심 원칙 (ft. 생성AI로 인사말 써 보기!) 프롬프트는 인공지능 모델에게 입력하는 지시문을 의미한다. 그러니까 챗GPT한테 이메일 작성을 요구했다면, 그 요구 사항이 프롬프트다. 그런데 많은 경우 프롬프트를 굉장히 부실하게 작성한다. 한국사람의 프롬프트가 부실한 이유는 평소에 우리의 말에서 단어의 생략이 많기 때문이라고 생각한다. 한국어로 대화할 때 주어를 구체적으로 명시하는 경우가 많지 않고, 서로 알고 있다고 생각하는 내용들도 과감히 생략해서 이야기하는 경우가 많다. 그러다 보니 우리는 원래 쓸모없는 단어를 줄여가면서 굉장히 효율적으로 대화를 하고 있다. 하지만 그런 효율적인 문장은 좋은 프롬프트라고 보긴 어렵다. 프롬프트 작성법 혹은 프롬프트 엔지니어링이라고 검색을 해보면 많은 블로그에서 정리하고 있는 내용들을 볼 수 있다. 그러한 노하우를 .. 2024. 9. 14.