All the BEST RAG Strategies in ONE MCP for AI Coding Assistants

영상 링크: All the BEST RAG Strategies in ONE MCP for AI Coding Assistants
채널명: Cole Medin

AI 코딩 어시스턴트를 위한 모든 최고의 RAG 전략, 하나의 MCP 서버에서! 핵심 요약

영상은 AI 코딩 어시스턴트가 프로젝트와 문서 이해에 한계를 갖는 문제, 특히 레퍼런스 오류(“hallucination”)를 해결하기 위해 ‘crawl for AI RAG MCP 서버’를 개발한 과정을 소개함
기존 Superbase, MCP, Pantic AI, Boomerang Tasks, Rue Code 등 다양한 툴이 분리되어 있는 환경에서, 이 MCP 서버는 단일 마스터 허브형 솔루션이 되는 것을 지향함
서버는 RAG(검색증강생성) 기반 최신 문서 제공, 에이전트 분업, 프로젝트 관리, 작업 플래닝 등 AI 코딩 어시스턴트의 핵심 니즈를 통합적으로 지원함
오픈소스·무료로 제공되며, 설치와 설정은 매우 간단하며 다양한 RAG 전략을 자유롭게 on/off 할 수 있음(Readme에서 가이드 제공)
Superbase와 연동하여 개별 프로젝트별 문서를 크롤링, 프라이빗 지식베이스에 저장하고, Versell AI SDK 공식 문서를 예시로 데모함
문서 크롤링 후 자체적으로 쪼개고(chunking), 코드 예제는 별도 벡터 DB에 저장하여 에이전트가 쉽게 참조하도록 하는 agentic rag 아키텍처 적용
Contextual Embeddings, Hybrid Search, Agentic RAG, Re-ranking 등 최신 RAG 전략이 단계별로 적용되어 정확한 검색과 답변, 코드 예제 활용 등이 강화됨
각 전략별로 소스 코드 구현, 예시 쿼리 및 아웃풋 과정 구체적으로 시연함
앞으로는 멀티 쿼리 rag, 지식 그래프 기반 rag 등 더 다양한 전략을 통합할 계획임을 밝힘
본 MCP 서버와 차세대 Archon 프로젝트를 공개적으로 지속 개발할 계획이며, 커뮤니티의 참여를 독려함

세부 요약 - 주제별 정리

AI 코딩 어시스턴트가 프로젝트 이해에 한계가 있다는 문제의식에서 솔루션 개발을 시작함

현재 AI 코딩 툴은 프로젝트 문서 및 맥락을 정확히 파악하지 못해 잦은 ‘hallucination’(잘못된 정보 생성)을 보임
외부 라이브러리(예: Superbase, MCP, Pantic AI 등) 활용 시 프로젝트 구조 및 문서 오해로 자주 문제 발생
이러한 한계를 해결하기 위해 ‘crawl for AI rag MCP 서버’를 직접 개발, 일부 구현 과정을 기존 채널에서 공유한 바 있음
기존 보유 툴(예: Boomerang Tasks, Rue Code, Context 7, Cloud Task Manager 등)이 각자 역할을 하지만, 통합성이 부족함을 인식
궁극적으로 “Archon”의 차세대 진화로 이 서버를 성장시키는 것이 목표임을 밝힘

모든 AI 코딩 보조 도구를 하나로 통합하는 마스터 MCP 서버의 비전 제시

분리된 여러 AI 코딩 지원 툴(문서 제공, 태스크 관리, 프로젝트 관리 등)을 하나의 MCP 서버에서 중앙 통제
RAG 기반 강력한 지식 기반, 역할별 분리된 에이전트 관리, 프로젝트 태스크 플래닝 및 동시 지원 목표
MCP 서버를 오픈소스로 공개하고, 손쉬운 설치 및 관리 방법(Readme 제공) 설명, 추가 RAG 전략 활성화도 선택적
AI 코딩 어시스턴트, 기타 AI 에이전트와 연동해 활용 가능(N8N, Windsurf 등 지원)
개별 프로젝트별, 라이브러리별 최신 문서 자동 수집·관리로 일관된 레퍼런스 제공

프라이빗 지식 베이스 구축을 위한 문서 크롤링 및 Superbase 연동 예시 시연

Versell AI SDK 공식 문서를 예시로 LLM 전용 Markdown 페이지에서 문서 전체 크롤링
MCP 서버가 단일 페이지/사이트맵 등 다양한 구조의 웹 문서 크롤링 지원(네비게이션 재귀적 탐색 가능)
Superbase와 연동되어, 크롤링한 문서가 자동으로 knowledge base(DB)에 저장됨
문서가 크고 방대한 경우 자동 쪼개기(chunking) 전략을 통해 검색 용이성 및 LLM 입력 효율화
코드 예제는 별도 vector DB(“코드 예제 테이블”)로 분리 저장하여, 문서와 예제를 별도로 빠르게 참조 가능

크롤링된 데이터로 AI 코딩 환경이 즉시 강화되는 실제 적용 예시 제시

AI IDE에서 “Versell AI SDK 문서를 활용해 OpenAI 모델에서 스트림 텍스트 출력 방법 설명 요청” 예제 실행
MCP 서버가 문서 + 코드 예제 DB에서 연관 데이터 검색, 적합한 예시/코드 조각 제공
결과로 IDE에 실제 사용할 수 있는 코딩 방법(return 방식, 함수 import 등)이 반환됨
실제 사이트 프론트엔드 UI를 예제로 개선하여 Cloud4 등 추가 연동에도 쉽게 활용됨을 시연

코드 예제를 별도 벡터 DB로 관리하는 agentic rag 아키텍처로 AI 보조가 실질적으로 강화됨

문서 전체와 코드 예제를 분리 저장해, AI가 텍스트 위주 문서와 실제 코드 활용 예시를 구분 가능
agentic rag 방식 도입으로 에이전트가 ‘어떤 정보(문서/코드)’를 검색할지 목적에 따라 스스로 판단
코드 예제만을 대상으로 rag 쿼리하도록 설계된 별도 API/함수 제공(예: “코드 예제 쿼리” vs “문서 쿼리”)
실제 검색 결과, “OpenAI 스트리밍 출력 예제” 등 구체적 요구에 신속히 부합하는 실제 예제 코드 반환

Contextual Embeddings로 문서 맥락을 LLM이 더 잘 이해하도록 개선함

Anthropic 팀의 contextual retrieval 논문 전략 실제 적용(논문 링크 영상 아래 제공)
문서를 가공할 때, 각 chunk 앞에 ‘이 조각이 전체 문서 내 어떤 역할/위치인지’ 추가 문맥 프롬프트 결과를 prepend
OpenAI API로 contextual embedding 생성, 향후 다양한 LLM·임베딩 모델도 지원 예정
데이터베이스에 저장된 chunk에는 “~~~” 구분자 기준 앞부분에 이 chunk의 가치를 요약한 문맥 정보가 들어감
특히 중간 위치 chunk에서 ‘이전/이후 내용’ 연결성이 보강, 검색 성능 향상에 기여

하이브리드(키워드+시맨틱) 검색 방식으로 rag 검색이 실제 질의에 더 매칭되게 함

RAG는 기본적으로 시맨틱(의미 기반) 검색이며, 키워드 매치는 부족함
‘Hyprid Search’ 설정 시, 키워드 기반 검색을 병행하여 실질적으로 필요한 키워드가 포함된 조각을 함께 반환
Superbase에서 케이스-인센서티브(keyword insensitive) 키워드 쿼리 수행, 예제 테이블/문서 테이블 모두 지원
N8N 연동 예시로 키워드+시맨틱 검색이 혼합된 결과를 AI 보조가 받아들이는 과정 시연

Re-ranking 전략으로 LLM 프롬프트 길이 문제를 해결하며 더욱 관련도 높은 결과만 반환

‘Re-ranking’은 검색된 다수 chunk(예: 50개)를 cross encoder(예: HuggingFace 모델)로 점수화해 관련 순서대로 정렬
로컬에서 cross encoder 모델 동작, 환경 변수로 re-ranking on/off 가능
rag 쿼리 시 re-rank된 점수로 상위 관련도 n개만 LLM으로 전달 → 프롬프트 부담 감소 및 답변 품질 향상
실제 실행 결과, 가장 상위 chunk가 AI가 최종 답변으로 선택한 예제와 일치(상위 3점, 하위 -10.4점 예시)

앞으로의 발전 방향으로 멀티 쿼리 및 지식그래프 기반 rag 등 다양한 확장 전략 계획

multi-query rag, query expansion, knowledge graph(graffiti, light rag 등) 적용 계획
Archon 프로젝트와 MCP 서버를 완전히 통합, 오토크롤링, UI에서 실시간 관리 등 전면적인 확장 예정
목표: 어떤 도메인/목적이든 활용 가능한 범용 rag MCP 서버를 만들어 AI 어시스턴트·에이전트의 지식 백본이 되도록
Archon을 공개적 오픈 소스 방식으로 커뮤니티와 협업 개발, 실제 프론트엔드 작업도 외부 참여자가 진행 중

오픈소스 개발 투명성, 커뮤니티 참여 독려 및 향후 개선 방향 공유

MCP 서버 및 Archon은 끝까지 무료·오픈소스 개방, 누구든지 PR·이슈 참여 가능
영상 설명란·깃허브·댓글 등 모든 채널로 커뮤니티 의견과 직접 참여 적극 수렴
지속적으로 영상/워크샵/코스 등으로 전략 세부 내용을 심화 공유할 계획
DynamiS AI Mastery 커뮤니티 및 온라인 코스에서 상세 도입 튜토리얼·심화 전략까지 지원 예정
본 MCP 서버/Archon이 AI 코딩 분야의 핵심 인프라로 진화하는 것을 함께 만들자는 비전 강조