반응형
진행 순서
프로젝트에서 사용되기 위한 RAG application은 가장 작지만 모든 기능을 갖춘 MVP RAG 부터 만들고 핵심부분들을 수정해 나가면서 개발할 예정이다. 추후 개발 상황에 따라 구현과정과 요소들이 달라질 수 있다.
- 가상환경 설정 및 MVP 구현
- Dataset과 Vector DB 구현
- Dataset 확보
- Vector DB 구현
- Embedding & Searching 구현
- Generation 구현
구현하려는 RAG의 역할
챗봇의 형태로 전달 받은 입력 값을 Embedding해서 데이터베이스에서 Generation을 위한 내용들을 Searching 하여 지정된 출력 형태로 생성하여 반환하다.
아래의 표는 사용된 프레임워크와 모델들이다.(많이 바뀔 예정)
| Platform | Huggingface |
| Framework: RAG | LangChain |
| Framework: API | FastAPI |
| Embedding Model | KoBart, KcBert, KoBert |
| Vector DB | Faiss, Chroma, Pinecone |
| LLM | chatGPT 3.5 Turbo |
반응형
그래서 가장 먼저 가상환경 설정 및 MVP RAG를 구현하여 프로젝트 Service용을 사용될 RAG에 대한 사전 작업을 진행할 예정이다.
RAG Step-by-Step: 가상환경 설정 및 MVP구현
RAG Step-by-Step: 가상환경 설정 및 MVP 구현
RAG 구현 Step-by-Step: Intro가상환경 설정 및 MVP 구현Dataset과 Vector DB 구현Embedding & Searching 구현Generation 구현 이전 Intro에 이어 RAG를 위한 가상환경과 RAG의 MVP(Most Viable Product) 선정하여 구현을 진행
youcanbeable.tistory.com
반응형
'AI > Gen AI' 카테고리의 다른 글
| RAG 구현 Step-by-Step Vector DB 구현 - 2: Faiss with LangChain (3) | 2024.09.17 |
|---|---|
| RAG 구현 Step-by-Step Vector DB 구현 - 1: Implementation Outline (1) | 2024.09.16 |
| RAG 구현 Step-by-Step Dataset 확보: Selenium을 활용한 Crawler (3) | 2024.09.02 |
| RAG 구현 Step-by-Step Dataset 확보 (1) | 2024.08.28 |
| RAG Step-by-Step: 가상환경 설정 및 MVP 구현 (0) | 2024.08.20 |