본문 바로가기

분류 전체보기107

Ch01-03. LLaMA 모델: Meta의 오픈 소스 혁신 Meta가 개발한 LLaMA(Large Language Model Meta AI)는 오픈 소스 기반의 대규모 언어 모델로, 자연어 처리와 생성 기술에서 주목받고 있습니다. 이 모델은 작은 크기로도 뛰어난 성능을 발휘하며, 연구자와 개발자들이 손쉽게 활용할 수 있는 것이 특징입니다.1. LLaMA의 특징과 성능오픈 소스: 누구나 모델을 다운로드하고 튜닝할 수 있어, 연구기관 및 개발자들이 다양하게 활용하고 있습니다.다양한 크기: 7B, 13B, 33B, 65B(LLaMA 1).성능: 13B 모델은 GPT-3(175B)와 비슷한 성능을 보이며, 효율성을 입증했습니다.2. LLaMA 2: 더 강력한 성능LLaMA 2는 이전 모델보다 학습 데이터를 40% 더 추가하여 성능이 크게 개선되었습니다.모델 크기: 7B.. 2024. 12. 20.
VM 서버를 잘못 생성했을 때 다른 서버로 이동하는 방법 VM을 잘못된 서버에 생성했을 경우 Move VM 기능을 사용하면 간단하게 다른 서버로 이동시킬 수 있습니다. 아래 단계를 따라 해보세요.1. VM 이동 조건서버가 꺼져있어야 합니다. VM이 실행 중이라면 먼저 종료한 뒤 이동을 진행하세요.2. 이동 방법Step 1: VM 선택XenCenter를 실행한 후 잘못 생성된 VM을 선택합니다. 오른쪽 클릭을 한 뒤 [Move VM...]을 클릭합니다.Step 2: 이동할 서버 선택이동할 서버의 스토리지를 선택합니다. 현재 위치는 회색 글씨로 표시됩니다.Step 3: 이동 실행이동할 서버를 선택한 후 [Move] 버튼을 클릭하면 이동이 시작됩니다.3. 이동 후 확인이동이 완료되면 선택한 서버의 Local Storage에 VM이 제대로 표시되는지 확인하세요.Tip.. 2024. 12. 19.
Ch01-02. GPT 모델의 발전 과정 OpenAI가 개발한 GPT 시리즈는 인공지능의 대규모 언어 모델(LLM) 분야에서 큰 혁신을 일으켰습니다. 아래에서 GPT 모델의 발전 과정을 단계별로 살펴보겠습니다.1. GPT-1: 기본 원칙의 확립GPT-1은 트랜스포머 아키텍처를 기반으로 한 최초의 사전 학습 언어 모델입니다. 대량의 텍스트 데이터를 학습해 문장의 다음 단어를 예측하는 원리로 작동했습니다.문장 내 각 단어의 의미를 파악하여 다음 단어를 예측서비스에 적용할 정도의 품질은 아니었음중요성: 이후 GPT 모델 발전의 토대를 마련2. GPT-2: 멀티태스킹과 뛰어난 성능GPT-2는 다양한 버전(Small, Medium, Large, Extra Large)으로 출시되었으며, 다음과 같은 특징을 보였습니다:정확한 문맥 파악과 연속적인 텍스트 생.. 2024. 12. 18.
Ch01-01. LLM 모델의 발전과 주요 특징 대규모 언어 모델(LLM)의 핵심 내용 정리1. 주요 LLM 모델 비교다음은 대표적인 LLM 모델의 비교표입니다.모델개발사대표 활용 앱모델 크기접근 방식GPTOpenAIChatGPT, Microsoft Copilot, Duolingo175B(GPT-3), 1.76T(GPT-4)APILLaMAMeta AI-7B, 13B, 70B (LLaMA2)오픈 소스GeminiGoogleGoogle Apps1.8B, 3.25B(Nano), Ultra(미정)APIClaudeAnthropicSlack, Notion, Quora미정API2. LLM 모델의 핵심 기술IN-CONTEXT LEARNING사전에 학습된 지식을 문맥에 맞게 변환하여 유연하게 대응하는 기술입니다. 예시 데이터의 질적 수준에 따라 결과가 크게 달라질 수 .. 2024. 12. 17.