AI/Gen AI

RAG 구현 Step-by-Step: Intro

문괜 2024. 8. 19. 12:00
반응형

진행 순서

프로젝트에서 사용되기 위한 RAG application은 가장 작지만 모든 기능을 갖춘 MVP RAG 부터 만들고 핵심부분들을 수정해 나가면서 개발할 예정이다. 추후 개발 상황에 따라 구현과정과 요소들이 달라질 수 있다. 

 

RAG 구현 Step-by-Step: Intro

  1. 가상환경 설정 및 MVP 구현
  2. Dataset과 Vector DB 구현
    1. Dataset 확보
    2. Vector DB 구현
  3. Embedding & Searching 구현
  4. Generation  구현

구현하려는 RAG의 역할

챗봇의 형태로 전달 받은 입력 값을 Embedding해서 데이터베이스에서 Generation을 위한 내용들을 Searching 하여 지정된 출력 형태로 생성하여 반환하다.

 

아래의 표는 사용된 프레임워크와 모델들이다.(많이 바뀔 예정)

Platform Huggingface
Framework: RAG LangChain
Framework: API FastAPI
Embedding Model KoBart, KcBert, KoBert
Vector DB Faiss, Chroma, Pinecone
LLM chatGPT 3.5 Turbo

 

반응형

 

그래서 가장 먼저 가상환경 설정 및 MVP RAG를 구현하여 프로젝트 Service용을 사용될 RAG에 대한 사전 작업을 진행할 예정이다.

 

RAG Step-by-Step: 가상환경 설정 및 MVP구현

 

RAG Step-by-Step: 가상환경 설정 및 MVP 구현

RAG 구현 Step-by-Step: Intro가상환경 설정 및 MVP 구현Dataset과 Vector DB 구현Embedding & Searching 구현Generation  구현 이전 Intro에 이어 RAG를 위한 가상환경과 RAG의 MVP(Most Viable Product) 선정하여 구현을 진행

youcanbeable.tistory.com

 

반응형