Introducing RAG 2.0: Agentic RAG + Knowledge Graphs (FREE Template)

영상 링크: Introducing RAG 2.0: Agentic RAG + Knowledge Graphs (FREE Template)
채널명: Cole Medin

RAG 2.0: 에이전틱 RAG와 지식 그래프의 결합 (무료 템플릿 공개) 핵심 요약

영상은 AI 에이전트가 다양한 지식을 효과적으로 검색하는 최적의 방식을 찾기 위해, 최근 주목받고 있는 ‘에이전틱 RAG’와 ‘지식 그래프’ 전략을 결합한 강력한 지식 검색 시스템을 소개함
주요 데모에서는 벡터 데이터베이스(Postgres + PG Vector 확장)와 지식 그래프(Neo4j + Graffiti) 두 가지 지식 저장소에 모두 접근 가능한 에이전트가 사용하는 전략의 차이를 보여줌
간단한 문서(대형 IT 기업들의 AI 전략)를 벡터 DB에 쪼개어 임베드하고, 동시에 지식 그래프로도 구조화해 저장함
에이전트는 사용자의 질문이 ‘특정 기업 정보 조회’면 벡터 DB, ‘기업 관계나 연관성’ 질문이면 지식 그래프, ‘복합 정보’면 양쪽을 모두 활용하도록 설계됨
전통적인 바닐라 RAG(문서 쪼개기+임베딩+유사도 검색)는 유연성이 부족하나, 에이전틱 RAG는 사용 목적·질문 패턴에 따라 다양한 검색 경로와 전략을 선택하는 유연성을 부여
초기 설정, 문서 인제스트, 데이터베이스 연결, 시스템 프롬프트 수정, 에이전트 구동, CLI 사용법 등 템플릿을 직접 따라 해볼 수 있게 단계별로 상세 설명
템플릿의 주요 스택 및 라이브러리: Podantic AI(에이전트 프레임워크), Graffiti(지식 그래프 라이브러리), Neo4j, Postgres(PG Vector), FastAPI, Claude Code(코딩 보조 AI) 등
Claude Code로 전체 구성을 설계·계획하고 코드까지 자동으로 생성하는 실제 프로세스와 효율성 시연
GitHub 저장소, 샘플 문서, env 세팅 예시, FastAPI·CLI 동시 가동 등 실전 구성 노하우도 공유
영상 마지막엔 Claude Code를 활용한 효율적 AI 프로젝트 설계 플로우와 팁 제공(글로벌 룰, planning.md, task.md, 예시 폴더 등 활용법 시연)

세부 요약 - 주제별 정리

에이전틱 RAG와 지식 그래프를 결합하면 AI 지식 검색이 훨씬 유연하고 강력해짐

영상의 핵심 목표는 AI 에이전트가 지식을 더 지능적으로 탐색·검색할 수 있는 최상의 구조를 찾는 것임
최근 집중적으로 실험한 두 전략이 ‘에이전틱 RAG(Agentic RAG)‘와 ‘지식 그래프(Knowledge Graph)‘임
이 두 가지를 결합하는 템플릿을 무료로 공개하며 영상 내에서 데모와 작동 원리, 구축 방법까지 모두 설명함
벡터 DB(비정형 정보 속성 검색)와 지식 그래프(관계·연결 탐색)를 동시에 활용, 질문의 성격에 맞는 최적의 검색 경로를 선택해 답변 품질을 극대화
예시: “구글의 AI 전략은?”(벡터DB) vs “OpenAI와 마이크로소프트의 관계는?”(지식그래프) vs “마이크로소프트의 전략과 Anthropic의 연관성은?”(둘 다 활용)
시스템 프롬프트에서 ‘질문 구조에 따라 어디를 탐색할지’ 규칙을 직접 지정할 수 있으며, 이를 통해 실전 적용도 간편

데모를 통해 벡터 DB와 지식 그래프의 차별화된 활용 사례를 보여줌

Postgres(Neon 플랫폼) + PG Vector 확장을 사용해 벡터 DB를 구성함
Neo4j(Graffiti 라이브러리 연동)로 지식 그래프를 구축, 주요 노드 연결(예: ‘아마존 ↔ Anthropic’ – AWS와의 관계, ‘OpenAI ↔ 마이크로소프트’ – Azure 의존 등)을 시각화해서 실제 데이터를 예시로 설명
데모 CLI에서 벡터 DB만 쓰는 검색, 지식그래프만 쓰는 관계 탐색, 두 개를 결합한 복합 검색을 각각 단계별로 실시간 시연
각 검색이 실행될 때 어떤 도구가 선택되어 동작했는지도 명확히 기록하여 사용자에게 검색 전략이 어떻게 동적으로 결정되는지 알 수 있음

바닐라 RAG의 한계와 에이전틱 RAG의 근본적 구조적 차이를 도식과 함께 설명함

바닐라 RAG(naive/classic/vanilla RAG): 문서를 작은 청크(Chunk)로 쪼개 임베딩 후 벡터 DB에 저장, 사용자 질문도 임베딩해 유사도 검색 후 답변에 활용
단점: 사용자가 다양한 지식 소스를 원해도 ‘벡터 DB 단일 경로’만 제공, 검색 전략도 사전에 고정
에이전틱 RAG: 에이전트가 스스로 ‘질문 유형’ 판단 후 벡터 DB/지식 그래프/웹 검색 등 다양한 도구/검색 경로를 조합하며 탐색 전략을 동적으로 설계
예: 회사 단일 정보→벡터 DB, 여러 회사간 관계→지식 그래프, 복합 질문→동시 다중 전략 적용
에이전트가 ‘검색 전략을 Reasoning’ 할 수 있다는 점이 가장 큰 장점

템플릿 구성 및 사용법을 단계별로 상세하게 가이드함(예시, 설치 과정, 환경 변수 등 구체 설명)

GitHub Readme와 동기화된 친절한 단계별 설명 제공
필요 사전 조건: Python, Postgres(Neon 등), Neo4j(로컬 패키지 or 데스크톱), 대형 언어모델 API Key(호환형 다양한 옵션 OpenAI, OlaMA, Gemini 등)
벡터 DB 세팅: SQL 폴더에 스키마 파일 예시를 제공하며, 사용하는 임베딩 모델(예: text-embed-3-small of OpenAI)의 벡터 차원(예: 1536)에 맞춰 컬럼 타입과 크기를 반드시 맞추라고 명시
Neon Platform의 무료 요금제 추천, 간단 프로젝트 생성 및 대시보드 연동 방법 안내
Neo4j 세팅법: 영상 내 로컬 AI 패키지 및 Neo4j 데스크탑 방식 두 가지로 안내
.env 세팅 내용과 주요 변수(데이터베이스 URL, Neo4j 접속 정보, LLM·임베딩 모델·Provider·API Key 각각 독립 설정 등) 예시
임베딩 LLM과 일반 LLM Provider를 분리 설정 가능해 최대 유연화

문서 인제스트 과정 및 벡터 DB/지식그래프 동시 구축 프로세스를 직접 시연함

문서 인제스트 시 ‘documents’ 폴더 아래 마크다운 문서 자동 탐지→벡터 DB, 지식 그래프 모두에 자동 저장
ingestion.py 스크립트와 d-clean 옵션(초기화용), 벡터 DB에는 청크 단위 초고속 삽입, 지식 그래프는 LLM을 통한 entity/relationship 추출·정의로 시간 소요(샘플 단일 문서 기준 수 초~2분 정도)
Graffiti, Neo4j 대시보드 활용하여 전체 엔티티·관계 시각적으로 확인 가능
인제스트 중 Table이 한번 Drop/재생성 되니 신규 프로젝트 기준으로 진행 추천

에이전트 시스템 프롬프트와 검색 전략 분기 기준 직접 설정 방법 안내

agent/prompts.py에서 시스템 프롬프트 구성(어느 상황에 벡터/그래프/둘 다 검색을 할지 명확히 텍스트로 지정)
예시: “두 회사 관련 질문이면 지식 그래프만, 단일 회사면 벡터DB만, 둘 다 요청 시에는 결합” 등
실전에서는 프롬프트를 더 유연하게 수정 권장(사용자는 벡터/그래프 존재를 몰라도 자연스럽게 활용하도록)

FastAPI 기반 API 구동 & CLI 동시 활용법 실습

FastAPI 서버 기동: python -m agent.api (포트 8058)
두 번째 터미널에서 CLI 실행: python cli.py
CLI에서 평범한 채팅(hi), 정보 검색, 관계 탐색 등 반복 시연, 각 검색의 도구 활용 로그(벡터/그래프) 명확히 확인 가능
API 직접 호출(curl 등) 및 스트리밍 응답도 가능

주요 기술 스택 및 핵심 라이브러리는 다음과 같음

Podantic AI : 에이전트 프레임워크(에이전트 추론/다중 전략 지원)
Graffiti : Knowledge Graph 라이브러리(Neo4j 연동)
Neo4j : 지식 그래프 저장소
Postgres(+PG Vector) : 벡터 DB 구성
FastAPI : API 서버
Claude Code : AI 자동 코딩 어시스턴트(MCP 서버, 대화형 설계/코딩/테스트 지원)
각각의 라이브러리, 플랫폼, 툴의 설치 및 활용법도 영상 내에서 구체적으로 언급

Claude Code를 활용한 플래닝/설계/코딩 자동화 전체 플로우를 세밀하게 공개함

Claude Code의 Plan Mode(shift+tab 2번) 진입, planning.md(아키텍처 설계), task.md(할 일 목록), claw.md(글로벌 룰) 세 개 핵심 문서 작성 지원
점진적 대화와 Q&A를 통해 Claude에 요구사항과 선호 아키텍처를 충분히 설명(폴더 구조, 기술 스택, 세부 설계 등)
MCP 서버(외부 문서 RAG · Neon DB 제어) 연동 예시→AI가 직접 Neon에 프로젝트 생성·SQL 실행·테이블 관리까지 자동 처리
Plan Mode 종료 후(shift+tab), ‘계획 및 태스크 파일을 참고해 실행하라’는 한 줄 프롬프트로 전체 빌드를 자동 실행
여러 단계에 걸친 승인(Approve) 방식 도입, 데이터베이스/코드/테스트 자동생성·반복 실행으로 최소 30분~1시간 이내 종합 프로젝트 생성 가능
예제 폴더(과거 코드, 설정 스니펫 등)를 참조해 Claude에게 모범 사례 학습을 유도, 보다 우수한 디자인/구현 유도
플래닝 문서 및 예시 파일을 GitHub에서 직접 확인 가능(예제 소스는 제외하고 플랜/룰/태스크만 공개)

템플릿 복제 후 즉시 적용해볼 수 있는 실전 팁과 코드 구성을 다양하게 지원

GitHub 저장소 링크 제공, Readme와 영상 설명이 1:1 매핑됨
문서 폴더에 샘플 문서 복붙→인제스트→API/CLI→질문, 탐색, 관계 분석까지 한번에 실행
환경 변수 예시와 LLM/임베딩 모델 다양성(클라우드·로컬 모두 대응), 벡터 사이즈 변경 등 실무 적용 관점의 유연성 극대화
추가 단축키/명령어, 유닛테스트, 문제 발생 시 문서화된 트러블슈팅까지 안내

지식 그래프 구축 시 LLM의 엔티티·관계 추출 비용과 시간 소요, 최적화 옵션까지 안내

벡터 DB 인제스트는 빠르나, 지식 그래프는 LLM 호출이 반복되므로 인서트 성능은 비교적 느림(2분 내외)
빠른 실험 원할 경우 ‘no knowledge graph 옵션’으로 속도 우선 실행 가능
인서트 후 그래프 쿼리는 매우 빠르나, 구축 인제스트는 시간·비용이 다소 발생함을 명시

전체 프로젝트의 구조, 명령어, API 문서화, 예제 테스트, 트러블슈팅까지 모두 지원

Readme에 CLI 상세 명령/구조/API·유닛테스트 설명 추가
문제발생시 의문 사항에 대한 Q&A와 트러블슈팅 가이드
핵심 예제(구글/아마존/Anthropic 등 대형 IT기업 AI 동향 문서)로 데모 재현

향후 연구·실험 방향 및 영상을 통한 커뮤니티 확장 목표 언급

추가적으로 Claude Code의 세부 활용법 영상화 예정
Dynamis 커뮤니티·YouTube 채널에서 RAG/에이전트 관련 추가 내용 지속적으로 소개 예정
Neon(Postgres 기반 클라우드 DB)과의 파트너십 하에 만들어진 프로젝트임도 언급