LLM

LLM (Large Language Model) 이란

인간의 언어를 이해하고 생성할 수 있도록 훈련된 인공지능 모델

주로 GPT(Generative Pre-trained Transformer) 구조를 기반으로 하며, 방대한 텍스트 데이터를 학습하여 문맥을 파악하고 자연스러운 언어로 응답하거나 텍스트 생성 가능

LLM은 먼저 대규모 텍스트 데이터(웹, 책, 위키 등)를 이용해 일반적인 언어 패턴을 비지도 학습 방식으로 학습

이 단계에서는 특정한 태스크(task)가 아니라, 문장의 다음 단어 예측 같은 일반적인 언어 모델링 과제를 수행

사전 학습된 모델을 특정 태스크에 맞게 추가 학습하는 단계

예를 들어, 고객 상담 챗봇을 만들고 싶다면, 상담 관련 데이터셋으로 미세 조정

지도 학습 방식으로 이루어지며, 비교적 적은 양의 데이터로도 가능