본문 바로가기

자연어 처리2

Ch03-02. Data Pipeline 구축 AI 고객센터(AICC)의 핵심 기능을 구현하기 위해서는 강력한 데이터 파이프라인이 필수적입니다.이번 포스팅에서는 AI 기반 고객 서비스의 핵심인 데이터 수집, 전처리, 변환, 벡터 DB 인덱싱까지의 흐름을 설명합니다.📌 데이터 파이프라인 개요데이터 파이프라인은 다양한 원천 데이터를 수집하고, 이를 AI 모델이 활용할 수 있도록 변환하는 과정입니다.일반적으로 데이터는 PDF, 워드, PPT, 한글 파일 등 비정형 형식으로 존재하며, 이를 AI가 학습할 수 있도록 변환해야 합니다.🔹 데이터 수집 및 전처리1️⃣ 데이터 소스: 고객 문서, 상담 녹취록, 제품 매뉴얼 등 다양한 문서 유형이 포함됩니다.2️⃣ 전처리 과정: 문서의 구조를 분석하고, 필요 없는 정보를 제거하는 과정이 필요합니다.단락 유지: 문.. 2025. 3. 24.
Ch01-01. LLM 모델의 발전과 주요 특징 대규모 언어 모델(LLM)의 핵심 내용 정리1. 주요 LLM 모델 비교다음은 대표적인 LLM 모델의 비교표입니다.모델개발사대표 활용 앱모델 크기접근 방식GPTOpenAIChatGPT, Microsoft Copilot, Duolingo175B(GPT-3), 1.76T(GPT-4)APILLaMAMeta AI-7B, 13B, 70B (LLaMA2)오픈 소스GeminiGoogleGoogle Apps1.8B, 3.25B(Nano), Ultra(미정)APIClaudeAnthropicSlack, Notion, Quora미정API2. LLM 모델의 핵심 기술IN-CONTEXT LEARNING사전에 학습된 지식을 문맥에 맞게 변환하여 유연하게 대응하는 기술입니다. 예시 데이터의 질적 수준에 따라 결과가 크게 달라질 수 .. 2024. 12. 17.