Don't Build Agents, Build Skills Instead - Barry Zhang & Mahesh Murag, Anthropic

영상 링크: Don’t Build Agents, Build Skills Instead – Barry Zhang & Mahesh Murag, Anthropic
채널명: AI Engineer

에이전트가 아니라 스킬을 만들어라 – Barry Zhang & Mahesh Murag, Anthropic 핵심 요약

Anthropic의 Barry Zhang과 Mahesh Murag는 더 이상 도메인별 에이전트(agent)를 만드는 대신, 에이전트가 쓸 수 있는 “스킬(skill)“을 구축하는 것이 효과적임을 주장함
“스킬”이란 에이전트가 현실 업무에서 전문성을 갖추기 위한 절차적 지식(스크립트, 코드, 설명 등)이 담긴 구조화된 폴더(파일 집합)를 의미함
코드 중심 접근으로, 에이전트(특히 Claude)가 API 호출, 데이터 관리, 분석 등을 코드 실행 방식으로 수행하고, 업무 자동화를 전체적으로 단순화함
도메인 전문성 문제를 해결하기 위해 반복 사용 가능한 “스킬” 구조를 도입, 파일과 스크립트의 재사용·조합성을 극대화
스킬은 Git, Google Drive, 압축파일 등 기존 파일 관리 방식과 완전히 호환되며, 누구나 손쉽게 생성·수정·공유할 수 있음
스킬은 “점진적 노출(progressive disclosure)” 방식을 채택, 실행 시점에만 필요한 메타데이터와 핵심 설명이 노출돼 에이전트의 맥락(context) 효율성을 높임
연구원, 파트너, 기업 등 다양한 주체가 기초 스킬, 외부 스킬, 기업·팀 맞춤형 스킬을 만들어 수천 개 생태계가 형성됨
스킬은 복잡도와 규모가 점점 커지며, MCP 서버(외부 서비스 연동)와의 조합을 통해 더 복잡한 업무 자동화와 전문성 확보를 실현함
비개발자(재무, 인사, 법무 등)도 스킬 구축에 참여해, 에이전트가 더 실질적인 현업 업무 처리가 가능해짐
OS와 소프트웨어 아키텍처에 비유해, 모델(프로세서), 런타임(운영체제), 스킬(응용 소프트웨어)이 결합된 구조로 진화함을 강조함

세부 요약 - 주제별 정리

에이전트의 한계를 인식하고 스킬 기반 접근의 필요성을 발견함

초기에는 다양한 업무/도메인마다 별도의 에이전트를 설계해야 한다고 생각했으나, 모델 수준에서 에이전트 구조가 충분히 범용적임을 확인
현존 에이전트는 지능과 잠재력은 가지지만 실제 업무에 필요한 “전문성”이 부족함
비유적으로, 수학 천재(Mahesh)가 세법을 처음부터 다시 배우며 업무를 처리하는 상황과 유사함
결국, 실제 환경에서는 일관적인 결과와 깊이 있는 도메인 전문성이 필요하다는 점을 인식함

”스킬” 구조는 코드 중심 파일 집합으로, 재사용성과 조합성이 극대화됨

스킬은 에이전트가 수행할 수 있는 절차지식(절차, 스크립트, 지침 등)을 담은 구조화된 폴더임
파일, 코드, 문서, 스크립트, 사용법 등 모든 내용을 포함하여 손쉽게 버전 관리 및 공유 가능
Git, Google Drive, 압축/이메일 전송 등 기존 파일 생태계와 완벽하게 통합
구성은 생각보다 단순하여, non-developer(비개발자)라도 누구나 생성 및 활용 가능
스킬 내 스크립트가 “도구”로 동작, 반복 업무 효율 증가 & 일관성·품질 관리 강화

코드와 스킬의 결합이 기존 툴의 한계를 극복함

“도구” 방식의 기존 접근은 설명 부족, 코드 수정 불가, 창의적 활용에 한계 등 문제가 있었음
코드와 스킬을 결합하면, 스크립트가 자기 설명성을 가지며(코드는 곧 문서/사용법), 필요할 때만 로드되어 맥락 창(window)을 절약함
Claude가 반복적으로 필요했던 파이썬 코드(예: 슬라이드 스타일 적용 등)를 스킬에 저장해 효율성/일관성 극대화

스킬은 점진적 노출 방식으로 수백/수천 개 조합에도 맥락 처리 효율을 유지함

스킬은 실행 시점에만 해당 폴더의 메타데이터와 핵심 지침을 모델에게 노출
실제 폴더 내 디렉터리/스크립트 등 모든 부가 자료는 필요 시에만 로드
덕분에 수백~수천 개 스킬을 동시에 탑재해도 에이전트 맥락(context) 처리에 무리가 없음

스킬 생태계는 기초/외부/기업맞춤형으로 확장 중이고, 사례도 다양함

기초 스킬: Claude가 오피스 문서 생성·편집 등 기존에 할 수 없었던 역량 획득
외부 파트너 스킬: Cadence 등에서 연구/바이오 분야 EHR 데이터 분석, 파이썬 바이오인포매틱스 등 전문 기능 구현
소프트웨어 통합: Browserbase의 stage hand(오픈소스 브라우저 자동화), Notion의 업무 공간 전반 리서치 등
기업·팀 맞춤 스킬: 포춘100 기업 등은 자사식 베스트프랙티스, 사내 특화 소프트웨어 활용법을 스킬로 패키징
대규모 개발/생산성: 수천~수만 개발자를 위한 코드 품질, 내부 협업, 문서화 등 개발팀 운영 노하우 내재화

스킬은 복잡성과 규모가 계속 증대하며, 도메인 지식을 더 체계적으로 포괄함

초기에는 skill.md 단일 마크다운 파일 수준에서 출발, 신속 개발 가능
최근은 소프트웨어 패키지, 실행 파일, 바이너리, 코드, 자산(asset) 등 복잡한 구조로 발전
기존 MCP(Multi-Component Platform) 툴과 워크플로우 오케스트레이션 기능을 결합, 복합적·외부 지향형 자동화 지원
외부 데이터, 외부 툴 연동(MCP)과 내부 전문성(스킬)이 자연스레 상호 보완됨

비개발자도 스킬 구축에 적극적으로 참여하여, 현업 노하우가 AI의 실제 능력으로 전환됨

회계, 재무, 리크루팅, 법무 등 IT 비전공자도 스킬을 쉽고 빠르게 제작하고 배포
현업 부서의 일상 업무 노하우(프로세스, 양식, 체크리스트, 컨설팅 문서 등)를 AI가 활용할 수 있도록 변환하는 과정에 참여
스킬 생태계 확장성을 증명하는 주요 사례로 제시됨

스킬 중심 에이전트 아키텍처가 표준화되고 있으며, 확장·적응성이 높음

최신 아키텍처는 에이전트 루프(컨텍스트 관리 + 토큰 흐름 관리), 파이시스템/코드 실행 환경, MCP 서버, 그리고 대량의 스킬 라이브러리로 구성됨
도메인별 신규 역량 추가가 매우 단순: 적합한 MCP 연결 + 관련된 스킬 라이브러리 장착
Anthropic은 출시 5주 만에 금융, 생명과학 등 각 산업별로 특화된 Claude 에이전트+스킬+MCP 조합을 빠르게 런칭

스킬의 미래 발전 방향: 소프트웨어처럼 테스트·버전관리·의존성 관리를 지향함

복잡한 스킬의 테스트/평가, 에이전트가 적절한 작업 시점에 올바른 스킬을 로드·트리거할 수 있는 검증/유효성 검사 도구 필요
스킬의 버전 업그레이드/변경사항 추적(라인리지) 체계화
스킬 간 의존성, MCP 서버 및 패키지 간 상호참조 기능을 추구, 복합 조합성을 높임
복수 스킬 조합 시 일관된 예측 가능성과 신뢰도 제공

스킬의 가치 핵심은 공유와 배포에 있으며, 조직 내외 지식의 축적·확산으로 이어짐

장기적으로 “지식 베이스”로 진화, 조직 구성원 및 AI가 지속적으로 절차적 역량/전문성을 축적하고 공유
신규 구성원이 Claude를 사용할 때 이미 조직의 노하우, 문화, 일상업무 방식이 내재화됨
조직별 성장뿐 아니라, 타 조직/커뮤니티 간 스킬 공유로 AI 활용 범위가 확장되고, 글로벌 에이전트 역량도 동반 성장

에이전트 아키텍처는 OS와 소프트웨어 생태계처럼 진화하며, 스킬이 그 중심에 있음

모델은 과거의 “프로세서”, 런타임은 “운영체제”, 스킬은 “소프트웨어”에 비유
프로세서와 OS만큼이나 중요한 것은, 수백만(누적) 개발자/현업 담당자가 만든 스킬(=AI용 SW)
저마다의 창의적, 실질적 문제 해결능력이 체계적으로 AI 에이전트에 쌓여간다는 점을 강조
결론적으로, 반복적인 에이전트 개발에서 벗어나 협업적·확장적 스킬 구축 생태계로의 전환을 촉구