The BIG Problem with MCP Servers (and the Solution!)

영상 링크: The BIG Problem with MCP Servers (and the Solution!)
채널명: Cole Medin

MCP 서버의 큰 문제점과 그 해결책! 핵심 요약

MCP(Multi-Component Protocol)는 지난 1년간 에이전트와 도구 및 데이터를 연결하는 주요 방식으로 자리 잡음.
그러나 MCP의 핵심 문제점으로는 토큰 비효율성(token inefficiency)과 컨텍스트 붕괴(context rot)가 있음. Anthropic(프로토콜 개발사)도 공식 블로그에서 이 문제를 인정함.
도구(툴) 정의와 각 툴 호출, 모든 기능이 대화 시작부터 컨텍스트 내에 포함되어, 기능 개수가 늘수록 토큰 사용량이 폭증함.
실제로 5개의 표준 MCP 코딩 서버만 연결했을 때도 기능 설명만으로 약 97,000 토큰이 사용되어 Claude Sonnet 4.5 모델의 컨텍스트의 48%를 차지함.
이러한 구조는 LLM의 토큰 한계에 근접하게 만들고, 초기화 상태부터 AI 에이전트를 과부하시키는 문제로 이어짐.
제안된 해결책은 ‘실시간 도구 발견(Real-time Tool Discovery)’ 및 ‘코드 실행(Code Execution)’ 방식 도입임: 에이전트가 실제로 필요할 때만 해당 기능 정보를 로드하고, 필요하면 코드를 생성하도록 함.
Anthropic이 최근 출시한 ‘Agent Skills’는 MCP의 문제를 해결하는 중요한 솔루션으로, 대화 초기엔 짧은 설명만 전달하고 필요 시 스킬(스크립트 및 지침)을 동적으로 불러옴.
이 방식은 MCP 대비 약 2~3%의 토큰만 사용하면서도, 기능 확장성과 유연성을 크게 높임.
다만 MCP는 여전히 선언적이고 예측 가능한 제어(control) 제공, 코드 실행 방식은 더 유연하지만 보안·복잡도의 트레이드오프 존재.
영상을 통해 MCP와 최신 코드 실행 기반 스킬 방식의 장단점, 실제 예시, 적용 방안이 상세히 소개됨.

세부 요약 - 주제별 정리

MCP는 빠르게 표준화됐으나 심각한 토큰 비효율과 고정성을 노출함

지난 1년 동안 MCP가 에이전트와 다양한 도구 및 데이터를 연결하는 대표적인 방법이 됨.
프로토콜의 인기와 함께, 토큰 사용과 컨텍스트 관리에서 심각한 문제가 드러남.
키워드는 ‘token consumption’과 ‘context rot(컨텍스트 붕괴)’로, 이러한 이슈는 대규모 언어모델(LLM) 활용의 본질적 문제로 부상.
Anthropic 스스로도 이 문제를 공식화하고 해결 방안을 발표함.
MCP는 기능성과 도구 정의를 대화 시작 시 한꺼번에 컨텍스트에 집어 넣는 구조라, 기능이 추가될수록 비효율적임.
하나의 MCP 서버당 수천 개 토큰이 단순 기능 설명에 소모되어, 도구 개수 증가 시 토큰 사용량이 기하급수적으로 증가함.
API 래퍼 구조로 간단하게 도구를 추가할 수 있으나, 그 대가로 대화 시작부터 에이전트가 과도한 정보에 노출됨.

실제 예시를 통해 MCP의 심각한 토큰 과다 문제를 입증함

AI 코딩용 표준 MCP 서버 5개만으로도 전체 컨텍스트의 97,000 토큰이 MCP 도구 정보로 사용됨.
Claude Sonnet 4.5 기준 최대 컨텍스트의 48%에 해당하는 수치로, 도구 기능 설명만으로 5만 토큰 가까이 차지함.
채널 운영자는 직접 ‘Cloud Code’ 내에서 /context 명령어로 토큰 사용량을 실증적으로 확인함.
최신 LLM(대규모 언어모델)의 토큰 관리 능력이 향상됐지만, 기초적으로 기능이 많아질수록 에이전트는 과부하에 빠짐.
과거 GPT-3.5 시절에는 MCP 에이전트가 몇 개의 도구만 다루는 것도 어려웠던 역사적 맥락이 소개됨.

초기화 시점에 도구 정보를 전부 로드하는 구조는 에이전트 확장성을 심각하게 제한함

대화 시작 시 모든 도구와 기능의 정의를 한 번에 집어넣기에, 실제 필요하지 않은 정보도 무조건 포함됨.
기능이 많아질수록 토큰 한계에 금방 도달하며, 이는 에이전트의 활용범위를 실질적으로 막음.
토큰을 한꺼번에 넣는다고 LLM이 이를 모두 효과적으로 쓰는 것도 아님; 초과 정보는 오히려 혼란, 과부하 초래.

토큰 효율성과 확장성, 유연성을 위해 “실시간 기능 발견 및 필요 시 로드” 방식이 필요함

해결책의 핵심은 요구 상황에서만 필요한 기능을 에이전트가 동적으로 불러오는 ‘리얼타임 디스커버리(Real-time Discovery)’임.
기능 전체를 미리 정의하지 않고, 실제 사용 시점에만 컨텍스트에 로드하도록 설계하면 토큰 부담이 대폭 줄어듦.
엔트로픽(Anthropic) 블로그의 다이어그램 예시로 ‘에이전트가 실시간 폴더 탐색 뒤 특정 기능(예: Google Drive)에만 관련 스크립트 로딩’이 소개됨.
사용자의 쿼리가 특정 도구 필요성을 암시할 때에만 관련 파일을 동적으로 읽어와 기능 확장 가능.

MCP 서버는 대부분 단순한 API 래퍼로, 코드 실행 기반 접근이 유리함

MCP 서버의 실제 역할은 에이전트가 특정 API 엔드포인트와 상호작용하도록 함수 집합(Instructions)을 미리 정의해주는 것임.
각 서버별 도구가 많아질수록 사전 정의가 비효율적.
예시로, 채널 운영자의 오픈소스 프로젝트 ‘Archon’도 MCP 서버를 통해 여러 API 엔드포인트와 연결됨.
제안: 에이전트가 직접 필요할 때 API 인터랙션 코드를 생성하게 두면, 미리 부하되는 토큰도 줄고 유연성도 향상.

에이전트가 직접 코드를 생성·저장·재사용하게 하면 토큰 부담 없이 확장성 획득

초기에 에이전트가 원하는 목적에 맞게 코드를 자동 생성(스크립트, 함수 등)하고 이를 저장해 두면, 향후 재사용 가능.
한 번 생성된 코드는 차후 동작 시마다 전체가 아니라 핵심 스크립트와 지침만 불러와 실행.
이 방식은 Claude의 “skills(스킬)” 개념과 밀접하게 연관되어 있음.
에이전트는 필요 시점에만 특정 스킬의 코드를 컨텍스트에 불러와, 초과 토큰 사용 없이 다양한 기능 수행 가능.

Anthropic의 “Agent Skills”는 MCP 한계 대응을 위한 결정적 돌파구임

최근 Anthropic이 내놓은 ‘Agent Skills’는 MCP의 토큰 이슈 해소에 매우 효과적임.
각 스킬은 대화 시작 시 에이전트에 간단한 한두 문장 설명만 제공(몇 백 토큰 이내).
실제 스킬(스크립트·지침)이 필요할 때에만 전체 기능 코드가 로딩됨.
이렇게 하면 MCP보다 초기 토큰 사용량이 2~3% 수준으로 크게 감소함.
Archon MCP 서버 역시 스킬 형태로 변환, 동일 기능 및 높은 토큰 효율성을 실증적으로 증명.

코드 실행 및 스킬 방식은 확장성과 효율성에서 뛰어나지만, 위험성과 복잡성도 존재함

코드 실행 방식은 매우 유연하지만, 보안(sandbox 환경), 권한 관리, 환경 변수 및 자격증명 세팅 등 까다로운 이슈가 따름.
MCP는 선언적이고 예측 가능한 방식으로, 어떤 도구와 기능이 제공되는지 명확히 제어할 수 있음(What You See Is What You Get).
코드 실행·스킬의 경우, 임의 코드 실행으로 인한 보안 취약성, 추가 관리 포인트가 존재.
예를 들어, 스킬의 환경 변수처리 등은 아직 업계에서 완전히 검증된 방안이 부족.
전체적으로 ‘제어(control)’와 ‘유연성(flexibility)’의 트레이드오프가 핵심.

MCP는 여전히 활용 가치가 있으며, 향후 유연성 위주 패러다임으로 옮겨갈 것으로 전망됨

MCP는 사용자 및 서비스 제공자가 정의한 기능만 활용하므로, 통제·예측이 가능하여 안전성 측면에서 강점.
스킬 및 코드 실행 방식은 대규모 기능 확장이 용이하고, 여러 기능을 필요 시점에만 활용할 수 있음.
LLM 성능이 계속 강화됨에 따라, 스킬 및 코드 실행 기반 유연성이 더욱 중요해질 전망.
에이전트의 자율성(autonomy)이라는 본질에 비추어도, 점차 코드 실행·스킬 방식이 시장에서 부각될 것으로 예상됨.

채널 운영자는 실제 Archon 스킬 적용과 Dynamus 커뮤니티 데모를 통해 효율성과 적용성을 입증함

직접 MCP 서버를 Archon 스킬 방식으로 변환하여, 초기 토큰 소모가 수천에서 수백 토큰 수준으로 대폭 감소했음을 시연.
동일한 기능을 훨씬 적은 토큰과 더 큰 유연성으로 제공함을 Dynamus 커뮤니티 데모를 통해 실증.
시청자는 Archon Skill을 직접 테스트해볼 수 있도록 영상 설명란에 링크를 제공함.

결론적으로, 제어와 유연성의 균형이 관건이며, AI 생태계에서 유연성 중심 전환이 가속화될 것임

MCP와 스킬/코드 실행 방식 모두 현 시점에서 각각 역할과 강점이 있음.
그러나 대규모 에이전트와 AI 시스템 확장, 토큰 비용 절감, 자율성 증대를 위해선 스킬과 코드 실행 방식이 점점 중요해질 전망임.
영상을 통해 MCP의 치명적 한계와 혁신적 대안이 구체적 데이터 및 예시와 함께 심도 있게 전달됨.