본문 바로가기

LLM5

Ch04-01. LLM(ChatGPT)를 활용한 불가능한 요청 탐지 불가능한 요청 탐지 (Detecting Impossible Requests)불가능한 요청 탐지는 AI 챗봇 및 고객 서비스 시스템의 신뢰성을 높이고, 잘못된 정보 제공을 방지하는 중요한 과정입니다. 이번 강의에서는 불가능한 요청을 탐지하는 방법과 실습을 통해 이를 구현하는 방안을 살펴보겠습니다.1️⃣ LLM의 환각 현상 (Hallucination)우선, LLM의 환각(Hallucination) 현상에 대해 이해해야 합니다. 이는 모델이 실제 데이터에 기반하지 않은 거짓된 정보를 마치 사실인 것처럼 그럴듯하게 생성하는 현상입니다.📌 환각 현상의 특징✔ 모든 LLM에서 공통적으로 발견됨 – ChatGPT, Google Gemini, Meta Llama 등 대부분의 모델에서 관찰됨✔ 주어진 정보가 부족할 때.. 2025. 3. 28.
Ch03-03. QA System 구축 AICC QA 시스템 구축AICC(인공지능 컨택센터)에서 QA 시스템이 어떻게 설계되고 운영되는지에 대해 알아보겠습니다.QA 시스템 개요QA 시스템은 사용자의 질문을 처리하고 적절한 응답을 제공하는 핵심 기술입니다. 구글 클라우드에서는 이를 "설빙 서브 시스템"이라고 부르며, 사용자의 질문을 분석하고 응답을 생성하는 역할을 담당합니다.QA 시스템의 주요 단계사용자 입력 처리: 챗봇, 모바일 앱 등에서 질문을 받음.질문 분석: 사용자의 질문을 벡터 임베딩으로 변환.시맨틱 검색 수행: 기존 데이터베이스에서 관련 문서를 검색.응답 생성: LLM이 검색된 컨텍스트를 기반으로 답변을 생성.응답 정제 및 전달: 응답을 필터링하고 사용자에게 제공.QA 시스템 구성 요소1. 오케스트레이터사용자의 질문을 분석하여 가장 .. 2025. 3. 26.
Ch03-02. Data Pipeline 구축 AI 고객센터(AICC)의 핵심 기능을 구현하기 위해서는 강력한 데이터 파이프라인이 필수적입니다.이번 포스팅에서는 AI 기반 고객 서비스의 핵심인 데이터 수집, 전처리, 변환, 벡터 DB 인덱싱까지의 흐름을 설명합니다.📌 데이터 파이프라인 개요데이터 파이프라인은 다양한 원천 데이터를 수집하고, 이를 AI 모델이 활용할 수 있도록 변환하는 과정입니다.일반적으로 데이터는 PDF, 워드, PPT, 한글 파일 등 비정형 형식으로 존재하며, 이를 AI가 학습할 수 있도록 변환해야 합니다.🔹 데이터 수집 및 전처리1️⃣ 데이터 소스: 고객 문서, 상담 녹취록, 제품 매뉴얼 등 다양한 문서 유형이 포함됩니다.2️⃣ 전처리 과정: 문서의 구조를 분석하고, 필요 없는 정보를 제거하는 과정이 필요합니다.단락 유지: 문.. 2025. 3. 24.
Ch02-03. Fine-tuning 🚀 LLM 파인튜닝(Fine-Tuning) 완벽 가이드LLM (대규모 언어 모델)을 파인튜닝(Fine-Tuning) 하는 방법과 최신 트렌드에 대해 알아보겠습니다. 최근 RAG (Retrieval-Augmented Generation) 방식이 널리 사용되고 있지만, 특정 도메인에 최적화된 LLM을 구축하려면 파인튜닝이 필수입니다.🔍 1. LLM 파인튜닝이 필요한 이유일반적인 LLM 모델은 방대한 데이터를 학습하지만, 특정 산업(예: 금융, 의료, 법률)에서는 더 정밀한 조정이 필요합니다. 최근 기업들은 작지만 강한 특화 모델을 만들기 위해 파인튜닝을 적극적으로 활용하고 있습니다.🛠️ 2. 파인튜닝의 주요 방법✅ 2.1 인스트럭션 튜닝 (Instruction Tuning)인스트럭션 튜닝이란, 자연어 .. 2025. 3. 20.