영상 링크: The BIG Problem with MCP Servers (and the Solution!)
채널명: Cole Medin
MCP 서버의 큰 문제점과 그 해결책! 핵심 요약
- MCP(Multi-Component Protocol)는 지난 1년간 에이전트와 도구 및 데이터를 연결하는 주요 방식으로 자리 잡음.
- 그러나 MCP의 핵심 문제점으로는 토큰 비효율성(token inefficiency)과 컨텍스트 붕괴(context rot)가 있음. Anthropic(프로토콜 개발사)도 공식 블로그에서 이 문제를 인정함.
- 도구(툴) 정의와 각 툴 호출, 모든 기능이 대화 시작부터 컨텍스트 내에 포함되어, 기능 개수가 늘수록 토큰 사용량이 폭증함.
- 실제로 5개의 표준 MCP 코딩 서버만 연결했을 때도 기능 설명만으로 약 97,000 토큰이 사용되어 Claude Sonnet 4.5 모델의 컨텍스트의 48%를 차지함.
- 이러한 구조는 LLM의 토큰 한계에 근접하게 만들고, 초기화 상태부터 AI 에이전트를 과부하시키는 문제로 이어짐.
- 제안된 해결책은 ‘실시간 도구 발견(Real-time Tool Discovery)’ 및 ‘코드 실행(Code Execution)’ 방식 도입임: 에이전트가 실제로 필요할 때만 해당 기능 정보를 로드하고, 필요하면 코드를 생성하도록 함.
- Anthropic이 최근 출시한 ‘Agent Skills’는 MCP의 문제를 해결하는 중요한 솔루션으로, 대화 초기엔 짧은 설명만 전달하고 필요 시 스킬(스크립트 및 지침)을 동적으로 불러옴.
- 이 방식은 MCP 대비 약 2~3%의 토큰만 사용하면서도, 기능 확장성과 유연성을 크게 높임.
- 다만 MCP는 여전히 선언적이고 예측 가능한 제어(control) 제공, 코드 실행 방식은 더 유연하지만 보안·복잡도의 트레이드오프 존재.
- 영상을 통해 MCP와 최신 코드 실행 기반 스킬 방식의 장단점, 실제 예시, 적용 방안이 상세히 소개됨.
세부 요약 - 주제별 정리
MCP는 빠르게 표준화됐으나 심각한 토큰 비효율과 고정성을 노출함
- 지난 1년 동안 MCP가 에이전트와 다양한 도구 및 데이터를 연결하는 대표적인 방법이 됨.
- 프로토콜의 인기와 함께, 토큰 사용과 컨텍스트 관리에서 심각한 문제가 드러남.
- 키워드는 ‘token consumption’과 ‘context rot(컨텍스트 붕괴)’로, 이러한 이슈는 대규모 언어모델(LLM) 활용의 본질적 문제로 부상.
- Anthropic 스스로도 이 문제를 공식화하고 해결 방안을 발표함.
- MCP는 기능성과 도구 정의를 대화 시작 시 한꺼번에 컨텍스트에 집어 넣는 구조라, 기능이 추가될수록 비효율적임.
- 하나의 MCP 서버당 수천 개 토큰이 단순 기능 설명에 소모되어, 도구 개수 증가 시 토큰 사용량이 기하급수적으로 증가함.
- API 래퍼 구조로 간단하게 도구를 추가할 수 있으나, 그 대가로 대화 시작부터 에이전트가 과도한 정보에 노출됨.
실제 예시를 통해 MCP의 심각한 토큰 과다 문제를 입증함
- AI 코딩용 표준 MCP 서버 5개만으로도 전체 컨텍스트의 97,000 토큰이 MCP 도구 정보로 사용됨.
- Claude Sonnet 4.5 기준 최대 컨텍스트의 48%에 해당하는 수치로, 도구 기능 설명만으로 5만 토큰 가까이 차지함.
- 채널 운영자는 직접 ‘Cloud Code’ 내에서
/context명령어로 토큰 사용량을 실증적으로 확인함. - 최신 LLM(대규모 언어모델)의 토큰 관리 능력이 향상됐지만, 기초적으로 기능이 많아질수록 에이전트는 과부하에 빠짐.
- 과거 GPT-3.5 시절에는 MCP 에이전트가 몇 개의 도구만 다루는 것도 어려웠던 역사적 맥락이 소개됨.
초기화 시점에 도구 정보를 전부 로드하는 구조는 에이전트 확장성을 심각하게 제한함
- 대화 시작 시 모든 도구와 기능의 정의를 한 번에 집어넣기에, 실제 필요하지 않은 정보도 무조건 포함됨.
- 기능이 많아질수록 토큰 한계에 금방 도달하며, 이는 에이전트의 활용범위를 실질적으로 막음.
- 토큰을 한꺼번에 넣는다고 LLM이 이를 모두 효과적으로 쓰는 것도 아님; 초과 정보는 오히려 혼란, 과부하 초래.
토큰 효율성과 확장성, 유연성을 위해 “실시간 기능 발견 및 필요 시 로드” 방식이 필요함
- 해결책의 핵심은 요구 상황에서만 필요한 기능을 에이전트가 동적으로 불러오는 ‘리얼타임 디스커버리(Real-time Discovery)’임.
- 기능 전체를 미리 정의하지 않고, 실제 사용 시점에만 컨텍스트에 로드하도록 설계하면 토큰 부담이 대폭 줄어듦.
- 엔트로픽(Anthropic) 블로그의 다이어그램 예시로 ‘에이전트가 실시간 폴더 탐색 뒤 특정 기능(예: Google Drive)에만 관련 스크립트 로딩’이 소개됨.
- 사용자의 쿼리가 특정 도구 필요성을 암시할 때에만 관련 파일을 동적으로 읽어와 기능 확장 가능.
MCP 서버는 대부분 단순한 API 래퍼로, 코드 실행 기반 접근이 유리함
- MCP 서버의 실제 역할은 에이전트가 특정 API 엔드포인트와 상호작용하도록 함수 집합(Instructions)을 미리 정의해주는 것임.
- 각 서버별 도구가 많아질수록 사전 정의가 비효율적.
- 예시로, 채널 운영자의 오픈소스 프로젝트 ‘Archon’도 MCP 서버를 통해 여러 API 엔드포인트와 연결됨.
- 제안: 에이전트가 직접 필요할 때 API 인터랙션 코드를 생성하게 두면, 미리 부하되는 토큰도 줄고 유연성도 향상.
에이전트가 직접 코드를 생성·저장·재사용하게 하면 토큰 부담 없이 확장성 획득
- 초기에 에이전트가 원하는 목적에 맞게 코드를 자동 생성(스크립트, 함수 등)하고 이를 저장해 두면, 향후 재사용 가능.
- 한 번 생성된 코드는 차후 동작 시마다 전체가 아니라 핵심 스크립트와 지침만 불러와 실행.
- 이 방식은 Claude의 “skills(스킬)” 개념과 밀접하게 연관되어 있음.
- 에이전트는 필요 시점에만 특정 스킬의 코드를 컨텍스트에 불러와, 초과 토큰 사용 없이 다양한 기능 수행 가능.
Anthropic의 “Agent Skills”는 MCP 한계 대응을 위한 결정적 돌파구임
- 최근 Anthropic이 내놓은 ‘Agent Skills’는 MCP의 토큰 이슈 해소에 매우 효과적임.
- 각 스킬은 대화 시작 시 에이전트에 간단한 한두 문장 설명만 제공(몇 백 토큰 이내).
- 실제 스킬(스크립트·지침)이 필요할 때에만 전체 기능 코드가 로딩됨.
- 이렇게 하면 MCP보다 초기 토큰 사용량이 2~3% 수준으로 크게 감소함.
- Archon MCP 서버 역시 스킬 형태로 변환, 동일 기능 및 높은 토큰 효율성을 실증적으로 증명.
코드 실행 및 스킬 방식은 확장성과 효율성에서 뛰어나지만, 위험성과 복잡성도 존재함
- 코드 실행 방식은 매우 유연하지만, 보안(sandbox 환경), 권한 관리, 환경 변수 및 자격증명 세팅 등 까다로운 이슈가 따름.
- MCP는 선언적이고 예측 가능한 방식으로, 어떤 도구와 기능이 제공되는지 명확히 제어할 수 있음(What You See Is What You Get).
- 코드 실행·스킬의 경우, 임의 코드 실행으로 인한 보안 취약성, 추가 관리 포인트가 존재.
- 예를 들어, 스킬의 환경 변수처리 등은 아직 업계에서 완전히 검증된 방안이 부족.
- 전체적으로 ‘제어(control)’와 ‘유연성(flexibility)’의 트레이드오프가 핵심.
MCP는 여전히 활용 가치가 있으며, 향후 유연성 위주 패러다임으로 옮겨갈 것으로 전망됨
- MCP는 사용자 및 서비스 제공자가 정의한 기능만 활용하므로, 통제·예측이 가능하여 안전성 측면에서 강점.
- 스킬 및 코드 실행 방식은 대규모 기능 확장이 용이하고, 여러 기능을 필요 시점에만 활용할 수 있음.
- LLM 성능이 계속 강화됨에 따라, 스킬 및 코드 실행 기반 유연성이 더욱 중요해질 전망.
- 에이전트의 자율성(autonomy)이라는 본질에 비추어도, 점차 코드 실행·스킬 방식이 시장에서 부각될 것으로 예상됨.
채널 운영자는 실제 Archon 스킬 적용과 Dynamus 커뮤니티 데모를 통해 효율성과 적용성을 입증함
- 직접 MCP 서버를 Archon 스킬 방식으로 변환하여, 초기 토큰 소모가 수천에서 수백 토큰 수준으로 대폭 감소했음을 시연.
- 동일한 기능을 훨씬 적은 토큰과 더 큰 유연성으로 제공함을 Dynamus 커뮤니티 데모를 통해 실증.
- 시청자는 Archon Skill을 직접 테스트해볼 수 있도록 영상 설명란에 링크를 제공함.
결론적으로, 제어와 유연성의 균형이 관건이며, AI 생태계에서 유연성 중심 전환이 가속화될 것임
- MCP와 스킬/코드 실행 방식 모두 현 시점에서 각각 역할과 강점이 있음.
- 그러나 대규모 에이전트와 AI 시스템 확장, 토큰 비용 절감, 자율성 증대를 위해선 스킬과 코드 실행 방식이 점점 중요해질 전망임.
- 영상을 통해 MCP의 치명적 한계와 혁신적 대안이 구체적 데이터 및 예시와 함께 심도 있게 전달됨.