개요
AI는 인간의 학습능력, 추론능력, 지각능력을 인공적으로 구현시키는 컴퓨터과학의 한 분야입니다.
그렇다면 생성형 AI는 대체 뭘까요?
조금 더 심화적인 정리는 LLM 모델에 관한 정리를 참고해주세요.
AI 관련 글을 쓰면 유입이 뛰는 것 같은데 저 글은 아무도 안보더라구요... 여기서라도 홍보하겠습니다.
생성형 AI
기존 AI들은 이미 쌓여있던 데이터를 학습해서 분석하는 역할을 주로 했습니다.
하지만 생성형 AI는 그 데이터를 분석하여 새로운 콘텐츠를 만드는 대에 초점을 두었죠.
저희가 흔히 쓰는 GPT. 그것도 마찬가지로 생성형 AI입니다.
이놈들은 엄청난 양의 텍스트 데이터를 처먹으며 자연스러운 문맥, 문장들을 학습하고 생성하는데에 특화돼있습니다.
그러니까 이 단어 다음에 올 가장 자연스러운 단어 리스트를 뽑아서 그 중 자연스러움의 비율이 가장 높은 단어를 뽑아와서 글을 잇습니다.
그리고 다른 생성형 AI인 요즘 디자이너들 다 실직한다고 호들갑 떨어대는 그림 생성 AI가 있습니다.
이 그림 생성 AI는 Diffusion Model을 기초적으로 하고 있습니다.
여기 모나리자 그림이 있다고 쳐봅시다.
이제 여기서 Noise를 엄청나게 추가합니다.
그리고 이 Noise가 엄청나게 낀 사진을 다시 복원해요.
이러한 과정을 무수히 학습하고나서 이제 원본사진 없이 노이즈만 잔뜩 낀 사진을 들고 AI에게 요청합니다.
'이거 사실 미소녀 사진이였는데 노이즈가 꼈음. 다시 노이즈 없애서 미소녀 사진으로 만들어주셈.'
이러한 요청을 받은 불쌍한 AI는 사악한 인간에게 속아 미소녀 사진을 짠 하고 생성해내게 됩니다.
사진의 원본이 있는 경우 조금 더 쉬운편입니다.
그냥 원본에 노이즈를 적당히 끼워준다음 받은 프롬프트를 이용하여 그림을 재생성하면 끝이죠.
물론 이건 정말 기초적인 토대입니다. 놀랍게도 소리를 만들어내는 AI도 Diffusion Model을 통해 만들어집니다.
음파, 그거 주파수로 나타내면 사실상 그림 아닙니까?
Diffusion Model에게 특정 목소리의 음성 파일을 학습시키면 어떤 음성 파일이던 대충 그 음파와 엇비슷하게 구성해준다는겁니다.
사실 저도 이건 잘 몰라요. 대충 그렇구나~ 하고 넘기는거지.
그래서 이 글 왜 씀?
ChatGPT가 막 부상할때부터 저는 AI에게 관심이 많았습니다.
지금은 API를 사용해보면서 Claude-3이나 GPT-4 turbo도 조금 건드려보고 있는데 솔직히 이거 진짜 물건입니다.
사실 사람 아닐까요 이것들?
그런 의미로 제가 알고 있는 AI에 대해 조금씩 적어보려고 합니다.
다음글은 node.js로 API 이용해서 AI 답변받기 정도가 될 것 같습니다.
저는 생성형 인공지능 중에는 텍스트 만들어 내는놈밖에 잘 모릅니다.
'기타 > AI' 카테고리의 다른 글
01. LLM 모델의 파라미터 (1) | 2024.04.09 |
---|