영상 링크: Katelyn Lesse – Evolving Claude APIs for Agents, Anthropic
채널명: AI Engineer
에이전트 개발을 위한 Claude API의 진화, Anthropic 핵심 요약
- Anthropic의 Caitlyn Lesse는 Claude 기반 에이전트 시스템 구축을 위한 API 플랫폼의 진화 방향을 상세히 소개함
- 플랫폼 혁신의 3대 축은 ① Claude의 고유 능력 활용 지원, ② 컨텍스트 윈도우 최적화 관리, ③ Claude에게 컴퓨터(실행 환경)를 할당하는 것임
- Claude Code 제품을 대표 예시로, 복잡한 코딩 작업 지원을 위해 API에서 다양한 커스터마이즈 기능을 제공 중임
- LLM의 사고 시간(추론 단계)을 개발자가 임의로 설정하고, 토큰 예산 관리를 통해 복잡성 별 성능 최적화 가능
- 도구 사용(툴 콜링) 능력이 강화되어, 웹 검색 등 사전 내장 도구 및 개발자가 정의한 커스텀 도구 연동을 신뢰성 높게 수행함
- MCP(모델 컨텍스트 프로토콜)와 메모리 툴, 컨텍스트 에디팅 기능 등으로 컨텍스트 윈도우를 유연하게 관리함
- 내부 평가에서 메모리와 컨텍스트 에디팅을 병행할 시 성능이 39% 향상됨(벤치마크 기준)
- 대규모 컨텍스트 윈도우(최대 100만 토큰 제공) 및 자동 컨텍스트 최적화 지원
- 코드 실행(샌드박스 환경) 인프라를 제공, 웹·모바일에서도 Claude가 자체적으로 코드 작성·실행 가능
- Agent Skills(스킬)는 도메인별 전문성을 Claude에게 부여, MCP·툴과 결합해 실제 업무 수행 능력을 증대함
세부 요약 - 주제별 정리
개발자들을 위한 Claude API는 점진적으로 에이전트 중심의 혁신 플랫폼으로 진화하고 있음
- Caitlyn Lesse는 Anthropic의 Claude 개발 플랫폼 팀 리더로, AI 인텔리전스 한계를 확장하는 개발자들과 협업을 중시함
- 발표 목적은 Claude를 활용해 강력한 에이전트 시스템을 구축하도록 지원하는 API 및 인프라 진화 방향을 공유하는 것임
- 참가자들 중 대부분이 LLM API 기반 에이전트 구축 경험을 가진 개발자임을 확인하고 실질적인 내용을 다룸
- Claude Code라는 에이전트형 코딩 제품을 예로 들어 진화 내용을 구체적으로 설명함
Claude의 능력을 최대한 활용할 수 있도록 API 커스터마이즈 기능을 강화함
- Claude는 다양한 작업에서 높은 성능을 보이며, API를 통해 특별한 방식으로 이런 능력을 노출함
- 예1) 추론 시간 조절: 개발자가 Claude에게 얼마나 길게 사고할지(시간 할당)를 선택 가능, 복잡한 문제일수록 더 많은 시간을 할당해 성능 개선
- 토큰 예산까지 설정하여, Claude가 사용할 ‘사고 비용’을 조정할 수 있음
- 예2) 도구(툴) 호출: Claude가 외부 도구를 신뢰성 있게 호출할 수 있으며, 내장 웹 검색 도구와 자체 커스텀 도구 등록 모두 지원
- 이름, 설명, 입력 스키마만 정의하면 도구 사용 가능
- Claude Code에서는 파일 읽기/쓰기, 테스트 실행 등 여러 도구를 빈번하게 호출하며 사용 중임
컨텍스트 윈도우(문맥 창) 관리가 Claude 성능 최적화의 핵심임을 강조함
- Claude가 최상의 성능을 내려면, 매 순간 적절한 정보만이 컨텍스트 윈도우 안에 유지되어야 함
- 특히 코딩 에이전트(Coding Agent)에서는 기술 설계서, 전체 코드베이스, 안내문, 도구 호출 결과 등 다양한 정보가 동시 탑재될 수 있음
- 컨텍스트 관리가 복잡해지므로, 올바른 구조와 전략이 필수적임
MCP(모델 컨텍스트 프로토콜)를 통한 외부 정보 및 도구와의 표준화된 상호작용 지원
- MCP는 외부 시스템(예: GitHub, Sentry 등)과 Claude 사이의 상호작용을 표준화하여 더욱 유연한 컨텍스트 확보를 가능케 함
- 개발자 / 에이전트가 단순히 입력 프롬프트 내 정보만 볼 수 있는 한계를 벗어나, 외부 도구와 데이터 소스에 능동적으로 접근 가능
- Claude Code도 MCP를 통해 외부에 분산된 기능/정보를 통합적으로 활용함
메모리 툴 도입으로 컨텍스트 바깥 정보의 저장 및 필요시 재활용을 실현함
- Claude는 메모리 툴을 활용해 ‘윈도우 밖’의 정보를 저장(파일 시스템 기반, 클라이언트 소유)하고, 필요시 이를 다시 불러올 수 있음
- 예: 코드베이스 패턴, Git 워크플로우 선호도 등을 메모리에 저장해 필요할 때만 꺼내어 컨텍스트 창에 넣음
- 윈도우 내 공간 확보와 장기적 맥락 유지 문제를 동시에 해결함
컨텍스트 에디팅 기능으로 불필요 정보의 자동 제거 및 윈도우 효율성을 대폭 향상시킴
- 메모리는 외부에 저장, 컨텍스트 에디팅은 현재 창에서 불필요한 정보를 삭제(특히 오래된 툴 실행 결과)하여 공간 확보에 기여
- 주요 이유: 과거의 툴 결과 데이터는 크기가 크고, 세션 후반부에는 최신 맥락 형성에 비효율적일 때가 많음
- Claude Code처럼 도구 호출이 수백 번 이뤄지는 상황에서 이 관리가 필수
- Anthropic 내부 평가에서 메모리+컨텍스트 에디팅을 조합할 때 벤치마크 대비 39% 성능 향상 확인
대용량 컨텍스트 윈도우(최대 100만 토큰)와 동적 컨텍스트 최적화로 Claude의 잠재력을 극대화함
- 일부 Claude 모델에서는 100만 토큰에 이르는 초대형 컨텍스트 윈도우 지원
- 대용량 윈도우 내에서 어떤 정보를 언제 채우고, 비우고, 불러올지에 대한 최적화 툴을 병행 제공
- Claude가 “컨텍스트 창”의 여유 공간 여부, 정보 품질 등을 스스로 파악하고 맥락에 맞는 응답을 하도록 설계됨
Claude에게 컴퓨터(실행 환경)를 할당하여 에이전트의 자율작업 능력을 획기적으로 강화함
- “Claude에게 컴퓨터를 주고 원하는 작업을 맡긴다”는 패러다임이 핵심
- 최근 논의가 많은 에이전트 하니스(harness, 작업 프레임워크) 설계와 관련, 무거운 스캐폴딩이 아니라 Claude 스스로 코드 작성-실행을 한 번에 하도록 함
- 실행 인프라, 보안, 도메인별 전문성 연결 등이 병렬로 필요
안전한 샌드박스 환경에서의 코드 실행 능력(API 상의 Code Execution Tool 제공)으로 실무 적용성을 높임
- Claude의 코드 실행 능력은 사용자가 직접 환경을 신경쓰지 않고, Anthropic 플랫폼이 컨테이너, 보안, 세션 관리 등을 책임짐
- Claude Code 웹/모바일 버전이 런칭되면서, 사용자가 접속을 종료해도 백그라운드에서 코드를 실행·유지함
- 예시: “애니메이션에 스파클 이펙트를 추가해줘”와 같은 명령을 Claude가 작성하고 즉시 실행함
Agent Skills(스킬) 도입으로 도메인별 전문성 자동 확장 및 실제 문제 해결력을 부여함
- Skills는 스크립트, 설명서, 리소스 폴더 등의 형태로 사전에 정의된 능력 묶음임
- Claude는 요청 및 Skill의 설명에 따라 필요한 스킬을 판단, 샌드박스 환경에서 실행함
- Skills와 MCP(외부 도구 및 데이터 접근)를 결합해, 단순한 답변이 아니라 실제 업무 처리가 가능한 에이전트 완성
- 예시: 웹 디자인 Skill 활용 시, 신제품용 랜딩 페이지를 사내 디자인 시스템 기준에 맞춰 자동 생성
플랫폼 지속 업그레이드와 개발자 지원을 약속하면서 Anthropic 팀 확대를 알림
- 플랫폼 발전 방향: Claude가 새로운 능력 또는 기존 능력을 심화할 때마다 API/인프라도 진화시켜 최첨단 성능 활용을 도모
- 메모리/컨텍스트 혁신, 에이전트 인프라·보안 샌드박스, 대규모 오케스트레이션 등 실질적 문제에 대한 지속적 개선 추진
- Anthropic은 개발자 친화 제품, 인프라, 엔드 프로덕트 디자인, Devril 등 전 분야에서 팀원 채용 중임을 알림