반응형
도대체 RAG는 뭘까? 에서 설명 했듯이 RAG의 경우 일반적인 수준의 LLM을 서비스의 의도에 맞게 결과를 생성하게 만드는 생성방식이다.
그러면 이런 RAG를 사용하는 이유가 뭘까?
RAG를 사용해야하는 이유는 아래와 같다.
- 현실적인 문제
- 시간: 프로젝트를 진행하는 목적은 다르겠지만 대부분의 프로젝트는 한정적인 시간을 가지고 있다. 반면에 기존의 LLM을 대체 할 수 있는 수준의 Model을 만드는데는 많은 시간이 든다.
- 규모: 지금 개인적인 현상황에 있어서 LLM을 만드는건 불가능하다. 기존의 성능을 내기 위한 데이터 확보 부터 구현과 테스트까지의 그 규모는 감당이 되지 않는다.
- 신뢰성
- 위의 문제들이 해결 된다해도 새로운 LLM을 처음부터 만드는 것은 신뢰성에 문제를 일으킨다. 현재 나온 LLM의 신뢰성이 보장 됐기에 사용된다. 허나 새로운 LLM은 신뢰성을 확보하기 위해서 긴 시간과 많은 노력이 든다.
- 효율
- 사실 위의 문제들에 대한 대체제는 Finetuning이라는 방식을 사용하면 어느 정도 해결이 된다. 하지만 Finetuning 역시 조정의 시간과 테스트의 기간과 투입해야하는 재원을 보면 효율적이라고는 할 수 없다.
그러면 굳이 왜 RAG를 사용해야 할 까?
바로 신뢰 받는 LLM에 재한된 혹은 이미 선별된 Resource를 바탕으로 서비스에 목적에 맞춰 생성이 가능하기 때문이다.
즉, RAG는 만능이 아니지만 현실적인 선안에서 효율적이고 신뢰도가 준수한 서비스에 맞는 생성형 ai를 만드는 방식이 될 수 있다.
반응형
'AI > Why?' 카테고리의 다른 글
Selenium vs. N8N 둘 중 더 나은게 뭘까? (0) | 2024.11.10 |
---|