상세 컨텐츠

본문 제목

Agents Companion (4): Agentic RAG: RAG의 결정적 진화

IT/Agentic AI

by HarimKang 2025. 5. 8. 16:06

본문

이전 글에서는 단일 에이전트를 넘어 여러 에이전트가 협력하여 복잡한 문제를 해결하는 '다중 에이전트 시스템'의 개념과 평가 방법까지 살펴보았죠. 이번 글에서는 다중 에이전트 아키텍처의 중요한 진화 형태인 Agentic RAG (Retrieval-Augmented Generation)에 대해 더 자세히 알아보겠습니다.

Agentic RAG란 무엇인가? ✨

Agentic RAG는 Retrieval-Augmented Generation (검색 증강 생성)의 강점과 AI 에이전트의 자율성을 결합한 고급 접근 방식입니다. 전통적인 RAG 시스템은 외부 지식 소스에서 관련 정보를 검색하여 언어 모델(LLM)의 답변 생성을 강화하는 방식에 의존합니다. 하지만 이러한 정적인 접근 방식은 모호하거나, 여러 단계를 거치거나, 다양한 관점을 요구하는 복잡한 질의를 처리할 때 종종 한계를 드러냅니다.

Agentic RAG는 여기서 한 단계 더 나아가, 지능형 에이전트를 활용하여 검색 프로세스를 오케스트레이션하고, 검색된 정보를 평가하며, 이를 가장 잘 활용하는 방법에 대해 스스로 판단할 수 있도록 합니다. 이는 단순히 정보를 가져오는 것을 넘어, 에이전트가 능동적으로 검색을 개선하고 정보를 검증하며 복잡한 문제 해결에 적용하는 것을 가능하게 합니다.

Agentic RAG의 중요성 및 장점 🤝

Agentic RAG는 여러 가지 중요한 장점을 제공합니다:

  • 향상된 정확성 (Improved Accuracy): 에이전트는 검색된 정보의 품질을 평가하고 어떤 소스를 신뢰할지 결정하여 더 정확하고 신뢰할 수 있는 응답을 생성할 수 있습니다.
  • 향상된 문맥 이해 (Enhanced Contextual Understanding): 에이전트는 사용자의 질의 문맥과 검색된 정보를 종합적으로 고려하여 더 관련성 높고 의미 있는 응답을 생성합니다.
  • 향상된 적응성 (Increased Adaptability): 에이전트는 변화하는 정보 요구에 적응하고 검색 전략을 동적으로 조정하여 가장 최신 정보와 관련 정보를 제공할 수 있습니다. 이는 정보가 끊임없이 진화하는 복잡한 영역(예: 의료, 금융, 법률 연구)에서 매우 중요합니다.

이러한 특징 덕분에 Agentic RAG는 특히 법률 연구, 과학 발견, 비즈니스 인텔리전스와 같이 복잡한 지식 검색 작업, 또는 의료 분야에서 복잡한 의료 데이터베이스, 연구 논문, 환자 기록을 탐색하는 데 매우 유용합니다.

Agentic RAG의 작동 방식 ✨

Agentic RAG는 자율적인 검색 에이전트(autonomous retrieval agents)를 도입하여 반복적인 추론에 기반하여 검색을 적극적으로 개선합니다. 구체적인 방식은 다음과 같습니다:

  • 문맥 인식 질의 확장 (Context-Aware Query Expansion): 단일 검색 패스에 의존하는 대신, 에이전트는 여러 개의 질의 개선(query refinements)을 생성하여 더 관련성 높고 포괄적인 결과를 검색합니다.
  • 다단계 추론 (Multi-Step Reasoning): 에이전트는 복잡한 질의를 더 작은 논리적 단계로 분해하고, 정보를 순차적으로 검색하여 구조화된 응답을 구축합니다. 이는 에이전트의 인지 기능 및 플래너 에이전트의 역할과 연결될 수 있습니다.
  • 적응적 소스 선택 (Adaptive Source Selection): 단일 벡터 데이터베이스에서 데이터를 가져오는 대신, 검색 에이전트는 문맥에 기반하여 가장 적합한 지식 소스(데이터 스토어 등)를 동적으로 선택합니다. 이는 도구 통합 및 도구/에이전트 레지스트리 개념과 관련 있습니다.
  • 검증 및 수정 (Validation and Correction): 평가자 에이전트(Evaluator Agents)는 최종 응답에 통합하기 전에 검색된 지식에 대해 환각(hallucinations)이나 모순이 있는지 교차 검증합니다.

이러한 과정을 통해 Agentic RAG는 응답의 정확성, 설명 가능성, 적응성을 크게 향상시킵니다.

더 나은 검색, 더 나은 RAG 🛤️

거의 모든 RAG 접근 방식은 관련 데이터를 색인화하고 검색하기 위한 검색 엔진을 필요로 합니다. 에이전트의 도입은 질의 개선, 필터링, 순위 지정, 최종 답변 생성 등을 가능하게 합니다. Agentic RAG 에이전트는 정보를 검색하기 위해 여러 번의 검색을 실행합니다.

기존 RAG 구현을 최적화하려는 개발자들에게는 에이전트를 도입하기 전에 기반이 되는 검색 결과(재현율로 측정)를 개선하는 것이 보통 가장 가치 있습니다. 검색 성능을 향상시키는 주요 기법들은 다음과 같습니다:

  • 원본 문서를 구문 분석하고 chunk로 분할: 복잡한 문서 레이아웃, 임베디드 테이블/이미지 등을 처리하고, 제목 계층 구조를 사용하여 주제별로 chunk를 유지하는 방식입니다.
  • chunks에 메타데이터 추가: 동의어, 키워드, 저자, 날짜, 태그, 카테고리 등을 추가하여 검색 결과의 부스팅, 제외, 필터링을 가능하게 합니다.
  • 임베딩 모델 미세 조정(Fine-tune) 또는 검색 어댑터 추가: 범용 임베딩 모델보다 특정 도메인을 더 잘 표현하도록 임베딩 공간을 변경합니다.
  • 더 빠른 벡터 데이터베이스 사용: 임베딩 검색 시 속도와 정확도 사이의 균형을 개선하여 지연 시간과 품질을 모두 향상시킬 수 있습니다. Vertex AI Vector Search(*google cloud)가 예시입니다.
  • 랭커(ranker) 사용: 벡터 검색은 빠르지만 근사적이므로, 수십 또는 수백 개의 결과를 반환할 수 있습니다. 이를 더 정교한 시스템으로 다시 순위 지정하여 상위 몇 개의 결과가 가장 관련성이 높거나 최고의 답변인지 확인해야 합니다.
  • 접지 확인 (Check Grounding) 구현: 생성된 답변의 각 구절이 실제로 검색된 청크에 의해 출처가 명확한지 확인하는 안전 장치입니다.

Vertex AI Search와 같은 도구는 고품질의 검색 기능을 제공하며(그런가..?), RAG Engine은 전체 파이프라인을 쉽게 오케스트레이션할 수 있도록 지원합니다. (-> 아무튼 Agentic RAG를 도입하기 전에, 위와 같은 방식을 통해 검색 자체를 먼저 개선시킨 이후에 에이전트 도입을 검토하자라는 의미)

추가로 볼만한 논문거리: [2501.09136] Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG

 

Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG

Large Language Models (LLMs) have revolutionized artificial intelligence (AI) by enabling human like text generation and natural language understanding. However, their reliance on static training data limits their ability to respond to dynamic, real time q

arxiv.org


이번 글에서는 Agentic RAG의 개념과 중요성, 작동 방식, 그리고 기존 RAG에서도 사용가능한 검색 성능 최적화의 중요성에 대해 살펴보았습니다. Agentic RAG는 단순히 정보를 가져오는 것을 넘어, 에이전트의 자율성을 활용하여 복잡한 지식 검색 문제를 더 효과적으로 해결할 수 있는 강력한 접근 방식입니다.

다음 글에서는 Agentic RAG에 이어, 실제 기업 환경에서 AI 에이전트가 어떻게 활용되고 있는지, Agents in the enterprise 파트에 대해서 더 자세히 알아보겠습니다.

https://davinci-ai.tistory.com/66

 

Agents Companion (5): 기업을 위한 에이전트?, Agents in the enterprise

이전 글에서는 Agentic RAG의 개념과 중요성, 작동 방식까지 살펴보았습니다. 이번 글에서는 이러한 AI 에이전트 기술이 실제 기업 환경에서 어떻게 활용될 수 있는지, "Agents in the enterprise" 파트에

davinci-ai.tistory.com

(해당 글은 구글의 Agents Companion White Paper 내용을 정리한 문서이며, 일부 필요에 따라 내용을 재배치하였습니다.)

반응형

관련글 더보기