영상 링크: Don’t Build Agents, Build Skills Instead – Barry Zhang & Mahesh Murag, Anthropic
채널명: AI Engineer
에이전트가 아니라 스킬을 만들어라 – Barry Zhang & Mahesh Murag, Anthropic 핵심 요약
- Anthropic의 Barry Zhang과 Mahesh Murag는 더 이상 도메인별 에이전트(agent)를 만드는 대신, 에이전트가 쓸 수 있는 “스킬(skill)“을 구축하는 것이 효과적임을 주장함
- “스킬”이란 에이전트가 현실 업무에서 전문성을 갖추기 위한 절차적 지식(스크립트, 코드, 설명 등)이 담긴 구조화된 폴더(파일 집합)를 의미함
- 코드 중심 접근으로, 에이전트(특히 Claude)가 API 호출, 데이터 관리, 분석 등을 코드 실행 방식으로 수행하고, 업무 자동화를 전체적으로 단순화함
- 도메인 전문성 문제를 해결하기 위해 반복 사용 가능한 “스킬” 구조를 도입, 파일과 스크립트의 재사용·조합성을 극대화
- 스킬은 Git, Google Drive, 압축파일 등 기존 파일 관리 방식과 완전히 호환되며, 누구나 손쉽게 생성·수정·공유할 수 있음
- 스킬은 “점진적 노출(progressive disclosure)” 방식을 채택, 실행 시점에만 필요한 메타데이터와 핵심 설명이 노출돼 에이전트의 맥락(context) 효율성을 높임
- 연구원, 파트너, 기업 등 다양한 주체가 기초 스킬, 외부 스킬, 기업·팀 맞춤형 스킬을 만들어 수천 개 생태계가 형성됨
- 스킬은 복잡도와 규모가 점점 커지며, MCP 서버(외부 서비스 연동)와의 조합을 통해 더 복잡한 업무 자동화와 전문성 확보를 실현함
- 비개발자(재무, 인사, 법무 등)도 스킬 구축에 참여해, 에이전트가 더 실질적인 현업 업무 처리가 가능해짐
- OS와 소프트웨어 아키텍처에 비유해, 모델(프로세서), 런타임(운영체제), 스킬(응용 소프트웨어)이 결합된 구조로 진화함을 강조함
세부 요약 - 주제별 정리
에이전트의 한계를 인식하고 스킬 기반 접근의 필요성을 발견함
- 초기에는 다양한 업무/도메인마다 별도의 에이전트를 설계해야 한다고 생각했으나, 모델 수준에서 에이전트 구조가 충분히 범용적임을 확인
- 현존 에이전트는 지능과 잠재력은 가지지만 실제 업무에 필요한 “전문성”이 부족함
- 비유적으로, 수학 천재(Mahesh)가 세법을 처음부터 다시 배우며 업무를 처리하는 상황과 유사함
- 결국, 실제 환경에서는 일관적인 결과와 깊이 있는 도메인 전문성이 필요하다는 점을 인식함
”스킬” 구조는 코드 중심 파일 집합으로, 재사용성과 조합성이 극대화됨
- 스킬은 에이전트가 수행할 수 있는 절차지식(절차, 스크립트, 지침 등)을 담은 구조화된 폴더임
- 파일, 코드, 문서, 스크립트, 사용법 등 모든 내용을 포함하여 손쉽게 버전 관리 및 공유 가능
- Git, Google Drive, 압축/이메일 전송 등 기존 파일 생태계와 완벽하게 통합
- 구성은 생각보다 단순하여, non-developer(비개발자)라도 누구나 생성 및 활용 가능
- 스킬 내 스크립트가 “도구”로 동작, 반복 업무 효율 증가 & 일관성·품질 관리 강화
코드와 스킬의 결합이 기존 툴의 한계를 극복함
- “도구” 방식의 기존 접근은 설명 부족, 코드 수정 불가, 창의적 활용에 한계 등 문제가 있었음
- 코드와 스킬을 결합하면, 스크립트가 자기 설명성을 가지며(코드는 곧 문서/사용법), 필요할 때만 로드되어 맥락 창(window)을 절약함
- Claude가 반복적으로 필요했던 파이썬 코드(예: 슬라이드 스타일 적용 등)를 스킬에 저장해 효율성/일관성 극대화
스킬은 점진적 노출 방식으로 수백/수천 개 조합에도 맥락 처리 효율을 유지함
- 스킬은 실행 시점에만 해당 폴더의 메타데이터와 핵심 지침을 모델에게 노출
- 실제 폴더 내 디렉터리/스크립트 등 모든 부가 자료는 필요 시에만 로드
- 덕분에 수백~수천 개 스킬을 동시에 탑재해도 에이전트 맥락(context) 처리에 무리가 없음
스킬 생태계는 기초/외부/기업맞춤형으로 확장 중이고, 사례도 다양함
- 기초 스킬: Claude가 오피스 문서 생성·편집 등 기존에 할 수 없었던 역량 획득
- 외부 파트너 스킬: Cadence 등에서 연구/바이오 분야 EHR 데이터 분석, 파이썬 바이오인포매틱스 등 전문 기능 구현
- 소프트웨어 통합: Browserbase의 stage hand(오픈소스 브라우저 자동화), Notion의 업무 공간 전반 리서치 등
- 기업·팀 맞춤 스킬: 포춘100 기업 등은 자사식 베스트프랙티스, 사내 특화 소프트웨어 활용법을 스킬로 패키징
- 대규모 개발/생산성: 수천~수만 개발자를 위한 코드 품질, 내부 협업, 문서화 등 개발팀 운영 노하우 내재화
스킬은 복잡성과 규모가 계속 증대하며, 도메인 지식을 더 체계적으로 포괄함
- 초기에는 skill.md 단일 마크다운 파일 수준에서 출발, 신속 개발 가능
- 최근은 소프트웨어 패키지, 실행 파일, 바이너리, 코드, 자산(asset) 등 복잡한 구조로 발전
- 기존 MCP(Multi-Component Platform) 툴과 워크플로우 오케스트레이션 기능을 결합, 복합적·외부 지향형 자동화 지원
- 외부 데이터, 외부 툴 연동(MCP)과 내부 전문성(스킬)이 자연스레 상호 보완됨
비개발자도 스킬 구축에 적극적으로 참여하여, 현업 노하우가 AI의 실제 능력으로 전환됨
- 회계, 재무, 리크루팅, 법무 등 IT 비전공자도 스킬을 쉽고 빠르게 제작하고 배포
- 현업 부서의 일상 업무 노하우(프로세스, 양식, 체크리스트, 컨설팅 문서 등)를 AI가 활용할 수 있도록 변환하는 과정에 참여
- 스킬 생태계 확장성을 증명하는 주요 사례로 제시됨
스킬 중심 에이전트 아키텍처가 표준화되고 있으며, 확장·적응성이 높음
- 최신 아키텍처는 에이전트 루프(컨텍스트 관리 + 토큰 흐름 관리), 파이시스템/코드 실행 환경, MCP 서버, 그리고 대량의 스킬 라이브러리로 구성됨
- 도메인별 신규 역량 추가가 매우 단순: 적합한 MCP 연결 + 관련된 스킬 라이브러리 장착
- Anthropic은 출시 5주 만에 금융, 생명과학 등 각 산업별로 특화된 Claude 에이전트+스킬+MCP 조합을 빠르게 런칭
스킬의 미래 발전 방향: 소프트웨어처럼 테스트·버전관리·의존성 관리를 지향함
- 복잡한 스킬의 테스트/평가, 에이전트가 적절한 작업 시점에 올바른 스킬을 로드·트리거할 수 있는 검증/유효성 검사 도구 필요
- 스킬의 버전 업그레이드/변경사항 추적(라인리지) 체계화
- 스킬 간 의존성, MCP 서버 및 패키지 간 상호참조 기능을 추구, 복합 조합성을 높임
- 복수 스킬 조합 시 일관된 예측 가능성과 신뢰도 제공
스킬의 가치 핵심은 공유와 배포에 있으며, 조직 내외 지식의 축적·확산으로 이어짐
- 장기적으로 “지식 베이스”로 진화, 조직 구성원 및 AI가 지속적으로 절차적 역량/전문성을 축적하고 공유
- 신규 구성원이 Claude를 사용할 때 이미 조직의 노하우, 문화, 일상업무 방식이 내재화됨
- 조직별 성장뿐 아니라, 타 조직/커뮤니티 간 스킬 공유로 AI 활용 범위가 확장되고, 글로벌 에이전트 역량도 동반 성장
에이전트 아키텍처는 OS와 소프트웨어 생태계처럼 진화하며, 스킬이 그 중심에 있음
- 모델은 과거의 “프로세서”, 런타임은 “운영체제”, 스킬은 “소프트웨어”에 비유
- 프로세서와 OS만큼이나 중요한 것은, 수백만(누적) 개발자/현업 담당자가 만든 스킬(=AI용 SW)
- 저마다의 창의적, 실질적 문제 해결능력이 체계적으로 AI 에이전트에 쌓여간다는 점을 강조
- 결론적으로, 반복적인 에이전트 개발에서 벗어나 협업적·확장적 스킬 구축 생태계로의 전환을 촉구