본문 바로가기
AI/AI 고객센터 서비스 구축

Ch02-01. Resources (Data, Library)

by upself 2025. 3. 13.
728x90


LLM(Large Language Model)의 성능을 결정하는 중요한 요소 중 하나는 데이터와 라이브러리입니다. 이번 글에서는 LLM이 학습하는 주요 데이터셋과, 모델 개발 및 최적화에 사용되는 필수 라이브러리를 정리하겠습니다.

1. LLM 학습을 위한 데이터셋

(1) 사전 학습 데이터 (Pre-training Data)

(2) 파인튜닝 및 평가 데이터 (Fine-tuning & Evaluation Data)

2. LLM 개발을 위한 라이브러리 및 프레임워크

(1) 모델 구축 및 학습 라이브러리

(2) 데이터 처리 및 검색 라이브러리

반응형