
영상 링크: Introducing RAG 2.0: Agentic RAG + Knowledge Graphs (FREE Template)
채널명: Cole Medin
RAG 2.0: 에이전틱 RAG와 지식 그래프의 결합 (무료 템플릿 공개) 핵심 요약
- 영상은 AI 에이전트가 다양한 지식을 효과적으로 검색하는 최적의 방식을 찾기 위해, 최근 주목받고 있는 ‘에이전틱 RAG’와 ‘지식 그래프’ 전략을 결합한 강력한 지식 검색 시스템을 소개함
- 주요 데모에서는 벡터 데이터베이스(Postgres + PG Vector 확장)와 지식 그래프(Neo4j + Graffiti) 두 가지 지식 저장소에 모두 접근 가능한 에이전트가 사용하는 전략의 차이를 보여줌
- 간단한 문서(대형 IT 기업들의 AI 전략)를 벡터 DB에 쪼개어 임베드하고, 동시에 지식 그래프로도 구조화해 저장함
- 에이전트는 사용자의 질문이 ‘특정 기업 정보 조회’면 벡터 DB, ‘기업 관계나 연관성’ 질문이면 지식 그래프, ‘복합 정보’면 양쪽을 모두 활용하도록 설계됨
- 전통적인 바닐라 RAG(문서 쪼개기+임베딩+유사도 검색)는 유연성이 부족하나, 에이전틱 RAG는 사용 목적·질문 패턴에 따라 다양한 검색 경로와 전략을 선택하는 유연성을 부여
- 초기 설정, 문서 인제스트, 데이터베이스 연결, 시스템 프롬프트 수정, 에이전트 구동, CLI 사용법 등 템플릿을 직접 따라 해볼 수 있게 단계별로 상세 설명
- 템플릿의 주요 스택 및 라이브러리: Podantic AI(에이전트 프레임워크), Graffiti(지식 그래프 라이브러리), Neo4j, Postgres(PG Vector), FastAPI, Claude Code(코딩 보조 AI) 등
- Claude Code로 전체 구성을 설계·계획하고 코드까지 자동으로 생성하는 실제 프로세스와 효율성 시연
- GitHub 저장소, 샘플 문서, env 세팅 예시, FastAPI·CLI 동시 가동 등 실전 구성 노하우도 공유
- 영상 마지막엔 Claude Code를 활용한 효율적 AI 프로젝트 설계 플로우와 팁 제공(글로벌 룰, planning.md, task.md, 예시 폴더 등 활용법 시연)
세부 요약 - 주제별 정리
에이전틱 RAG와 지식 그래프를 결합하면 AI 지식 검색이 훨씬 유연하고 강력해짐
- 영상의 핵심 목표는 AI 에이전트가 지식을 더 지능적으로 탐색·검색할 수 있는 최상의 구조를 찾는 것임
- 최근 집중적으로 실험한 두 전략이 ‘에이전틱 RAG(Agentic RAG)‘와 ‘지식 그래프(Knowledge Graph)‘임
- 이 두 가지를 결합하는 템플릿을 무료로 공개하며 영상 내에서 데모와 작동 원리, 구축 방법까지 모두 설명함
- 벡터 DB(비정형 정보 속성 검색)와 지식 그래프(관계·연결 탐색)를 동시에 활용, 질문의 성격에 맞는 최적의 검색 경로를 선택해 답변 품질을 극대화
- 예시: “구글의 AI 전략은?”(벡터DB) vs “OpenAI와 마이크로소프트의 관계는?”(지식그래프) vs “마이크로소프트의 전략과 Anthropic의 연관성은?”(둘 다 활용)
- 시스템 프롬프트에서 ‘질문 구조에 따라 어디를 탐색할지’ 규칙을 직접 지정할 수 있으며, 이를 통해 실전 적용도 간편
데모를 통해 벡터 DB와 지식 그래프의 차별화된 활용 사례를 보여줌
- Postgres(Neon 플랫폼) + PG Vector 확장을 사용해 벡터 DB를 구성함
- Neo4j(Graffiti 라이브러리 연동)로 지식 그래프를 구축, 주요 노드 연결(예: ‘아마존 ↔ Anthropic’ – AWS와의 관계, ‘OpenAI ↔ 마이크로소프트’ – Azure 의존 등)을 시각화해서 실제 데이터를 예시로 설명
- 데모 CLI에서 벡터 DB만 쓰는 검색, 지식그래프만 쓰는 관계 탐색, 두 개를 결합한 복합 검색을 각각 단계별로 실시간 시연
- 각 검색이 실행될 때 어떤 도구가 선택되어 동작했는지도 명확히 기록하여 사용자에게 검색 전략이 어떻게 동적으로 결정되는지 알 수 있음
바닐라 RAG의 한계와 에이전틱 RAG의 근본적 구조적 차이를 도식과 함께 설명함
- 바닐라 RAG(naive/classic/vanilla RAG): 문서를 작은 청크(Chunk)로 쪼개 임베딩 후 벡터 DB에 저장, 사용자 질문도 임베딩해 유사도 검색 후 답변에 활용
- 단점: 사용자가 다양한 지식 소스를 원해도 ‘벡터 DB 단일 경로’만 제공, 검색 전략도 사전에 고정
- 에이전틱 RAG: 에이전트가 스스로 ‘질문 유형’ 판단 후 벡터 DB/지식 그래프/웹 검색 등 다양한 도구/검색 경로를 조합하며 탐색 전략을 동적으로 설계
- 예: 회사 단일 정보→벡터 DB, 여러 회사간 관계→지식 그래프, 복합 질문→동시 다중 전략 적용
- 에이전트가 ‘검색 전략을 Reasoning’ 할 수 있다는 점이 가장 큰 장점
템플릿 구성 및 사용법을 단계별로 상세하게 가이드함(예시, 설치 과정, 환경 변수 등 구체 설명)
- GitHub Readme와 동기화된 친절한 단계별 설명 제공
- 필요 사전 조건: Python, Postgres(Neon 등), Neo4j(로컬 패키지 or 데스크톱), 대형 언어모델 API Key(호환형 다양한 옵션 OpenAI, OlaMA, Gemini 등)
- 벡터 DB 세팅: SQL 폴더에 스키마 파일 예시를 제공하며, 사용하는 임베딩 모델(예: text-embed-3-small of OpenAI)의 벡터 차원(예: 1536)에 맞춰 컬럼 타입과 크기를 반드시 맞추라고 명시
- Neon Platform의 무료 요금제 추천, 간단 프로젝트 생성 및 대시보드 연동 방법 안내
- Neo4j 세팅법: 영상 내 로컬 AI 패키지 및 Neo4j 데스크탑 방식 두 가지로 안내
- .env 세팅 내용과 주요 변수(데이터베이스 URL, Neo4j 접속 정보, LLM·임베딩 모델·Provider·API Key 각각 독립 설정 등) 예시
- 임베딩 LLM과 일반 LLM Provider를 분리 설정 가능해 최대 유연화
문서 인제스트 과정 및 벡터 DB/지식그래프 동시 구축 프로세스를 직접 시연함
- 문서 인제스트 시 ‘documents’ 폴더 아래 마크다운 문서 자동 탐지→벡터 DB, 지식 그래프 모두에 자동 저장
- ingestion.py 스크립트와 d-clean 옵션(초기화용), 벡터 DB에는 청크 단위 초고속 삽입, 지식 그래프는 LLM을 통한 entity/relationship 추출·정의로 시간 소요(샘플 단일 문서 기준 수 초~2분 정도)
- Graffiti, Neo4j 대시보드 활용하여 전체 엔티티·관계 시각적으로 확인 가능
- 인제스트 중 Table이 한번 Drop/재생성 되니 신규 프로젝트 기준으로 진행 추천
에이전트 시스템 프롬프트와 검색 전략 분기 기준 직접 설정 방법 안내
- agent/prompts.py에서 시스템 프롬프트 구성(어느 상황에 벡터/그래프/둘 다 검색을 할지 명확히 텍스트로 지정)
- 예시: “두 회사 관련 질문이면 지식 그래프만, 단일 회사면 벡터DB만, 둘 다 요청 시에는 결합” 등
- 실전에서는 프롬프트를 더 유연하게 수정 권장(사용자는 벡터/그래프 존재를 몰라도 자연스럽게 활용하도록)
FastAPI 기반 API 구동 & CLI 동시 활용법 실습
- FastAPI 서버 기동: python -m agent.api (포트 8058)
- 두 번째 터미널에서 CLI 실행: python cli.py
- CLI에서 평범한 채팅(hi), 정보 검색, 관계 탐색 등 반복 시연, 각 검색의 도구 활용 로그(벡터/그래프) 명확히 확인 가능
- API 직접 호출(curl 등) 및 스트리밍 응답도 가능
주요 기술 스택 및 핵심 라이브러리는 다음과 같음
- Podantic AI : 에이전트 프레임워크(에이전트 추론/다중 전략 지원)
- Graffiti : Knowledge Graph 라이브러리(Neo4j 연동)
- Neo4j : 지식 그래프 저장소
- Postgres(+PG Vector) : 벡터 DB 구성
- FastAPI : API 서버
- Claude Code : AI 자동 코딩 어시스턴트(MCP 서버, 대화형 설계/코딩/테스트 지원)
- 각각의 라이브러리, 플랫폼, 툴의 설치 및 활용법도 영상 내에서 구체적으로 언급
Claude Code를 활용한 플래닝/설계/코딩 자동화 전체 플로우를 세밀하게 공개함
- Claude Code의 Plan Mode(shift+tab 2번) 진입, planning.md(아키텍처 설계), task.md(할 일 목록), claw.md(글로벌 룰) 세 개 핵심 문서 작성 지원
- 점진적 대화와 Q&A를 통해 Claude에 요구사항과 선호 아키텍처를 충분히 설명(폴더 구조, 기술 스택, 세부 설계 등)
- MCP 서버(외부 문서 RAG · Neon DB 제어) 연동 예시→AI가 직접 Neon에 프로젝트 생성·SQL 실행·테이블 관리까지 자동 처리
- Plan Mode 종료 후(shift+tab), ‘계획 및 태스크 파일을 참고해 실행하라’는 한 줄 프롬프트로 전체 빌드를 자동 실행
- 여러 단계에 걸친 승인(Approve) 방식 도입, 데이터베이스/코드/테스트 자동생성·반복 실행으로 최소 30분~1시간 이내 종합 프로젝트 생성 가능
- 예제 폴더(과거 코드, 설정 스니펫 등)를 참조해 Claude에게 모범 사례 학습을 유도, 보다 우수한 디자인/구현 유도
- 플래닝 문서 및 예시 파일을 GitHub에서 직접 확인 가능(예제 소스는 제외하고 플랜/룰/태스크만 공개)
템플릿 복제 후 즉시 적용해볼 수 있는 실전 팁과 코드 구성을 다양하게 지원
- GitHub 저장소 링크 제공, Readme와 영상 설명이 1:1 매핑됨
- 문서 폴더에 샘플 문서 복붙→인제스트→API/CLI→질문, 탐색, 관계 분석까지 한번에 실행
- 환경 변수 예시와 LLM/임베딩 모델 다양성(클라우드·로컬 모두 대응), 벡터 사이즈 변경 등 실무 적용 관점의 유연성 극대화
- 추가 단축키/명령어, 유닛테스트, 문제 발생 시 문서화된 트러블슈팅까지 안내
지식 그래프 구축 시 LLM의 엔티티·관계 추출 비용과 시간 소요, 최적화 옵션까지 안내
- 벡터 DB 인제스트는 빠르나, 지식 그래프는 LLM 호출이 반복되므로 인서트 성능은 비교적 느림(2분 내외)
- 빠른 실험 원할 경우 ‘no knowledge graph 옵션’으로 속도 우선 실행 가능
- 인서트 후 그래프 쿼리는 매우 빠르나, 구축 인제스트는 시간·비용이 다소 발생함을 명시
전체 프로젝트의 구조, 명령어, API 문서화, 예제 테스트, 트러블슈팅까지 모두 지원
- Readme에 CLI 상세 명령/구조/API·유닛테스트 설명 추가
- 문제발생시 의문 사항에 대한 Q&A와 트러블슈팅 가이드
- 핵심 예제(구글/아마존/Anthropic 등 대형 IT기업 AI 동향 문서)로 데모 재현
향후 연구·실험 방향 및 영상을 통한 커뮤니티 확장 목표 언급
- 추가적으로 Claude Code의 세부 활용법 영상화 예정
- Dynamis 커뮤니티·YouTube 채널에서 RAG/에이전트 관련 추가 내용 지속적으로 소개 예정
- Neon(Postgres 기반 클라우드 DB)과의 파트너십 하에 만들어진 프로젝트임도 언급