Katelyn Lesse - Evolving Claude APIs for Agents, Anthropic

영상 링크: Katelyn Lesse – Evolving Claude APIs for Agents, Anthropic
채널명: AI Engineer

에이전트 개발을 위한 Claude API의 진화, Anthropic 핵심 요약

Anthropic의 Caitlyn Lesse는 Claude 기반 에이전트 시스템 구축을 위한 API 플랫폼의 진화 방향을 상세히 소개함
플랫폼 혁신의 3대 축은 ① Claude의 고유 능력 활용 지원, ② 컨텍스트 윈도우 최적화 관리, ③ Claude에게 컴퓨터(실행 환경)를 할당하는 것임
Claude Code 제품을 대표 예시로, 복잡한 코딩 작업 지원을 위해 API에서 다양한 커스터마이즈 기능을 제공 중임
LLM의 사고 시간(추론 단계)을 개발자가 임의로 설정하고, 토큰 예산 관리를 통해 복잡성 별 성능 최적화 가능
도구 사용(툴 콜링) 능력이 강화되어, 웹 검색 등 사전 내장 도구 및 개발자가 정의한 커스텀 도구 연동을 신뢰성 높게 수행함
MCP(모델 컨텍스트 프로토콜)와 메모리 툴, 컨텍스트 에디팅 기능 등으로 컨텍스트 윈도우를 유연하게 관리함
내부 평가에서 메모리와 컨텍스트 에디팅을 병행할 시 성능이 39% 향상됨(벤치마크 기준)
대규모 컨텍스트 윈도우(최대 100만 토큰 제공) 및 자동 컨텍스트 최적화 지원
코드 실행(샌드박스 환경) 인프라를 제공, 웹·모바일에서도 Claude가 자체적으로 코드 작성·실행 가능
Agent Skills(스킬)는 도메인별 전문성을 Claude에게 부여, MCP·툴과 결합해 실제 업무 수행 능력을 증대함

세부 요약 - 주제별 정리

개발자들을 위한 Claude API는 점진적으로 에이전트 중심의 혁신 플랫폼으로 진화하고 있음

Caitlyn Lesse는 Anthropic의 Claude 개발 플랫폼 팀 리더로, AI 인텔리전스 한계를 확장하는 개발자들과 협업을 중시함
발표 목적은 Claude를 활용해 강력한 에이전트 시스템을 구축하도록 지원하는 API 및 인프라 진화 방향을 공유하는 것임
참가자들 중 대부분이 LLM API 기반 에이전트 구축 경험을 가진 개발자임을 확인하고 실질적인 내용을 다룸
Claude Code라는 에이전트형 코딩 제품을 예로 들어 진화 내용을 구체적으로 설명함

Claude의 능력을 최대한 활용할 수 있도록 API 커스터마이즈 기능을 강화함

Claude는 다양한 작업에서 높은 성능을 보이며, API를 통해 특별한 방식으로 이런 능력을 노출함
예1) 추론 시간 조절: 개발자가 Claude에게 얼마나 길게 사고할지(시간 할당)를 선택 가능, 복잡한 문제일수록 더 많은 시간을 할당해 성능 개선
- 토큰 예산까지 설정하여, Claude가 사용할 ‘사고 비용’을 조정할 수 있음
예2) 도구(툴) 호출: Claude가 외부 도구를 신뢰성 있게 호출할 수 있으며, 내장 웹 검색 도구와 자체 커스텀 도구 등록 모두 지원
- 이름, 설명, 입력 스키마만 정의하면 도구 사용 가능
- Claude Code에서는 파일 읽기/쓰기, 테스트 실행 등 여러 도구를 빈번하게 호출하며 사용 중임

컨텍스트 윈도우(문맥 창) 관리가 Claude 성능 최적화의 핵심임을 강조함

Claude가 최상의 성능을 내려면, 매 순간 적절한 정보만이 컨텍스트 윈도우 안에 유지되어야 함
특히 코딩 에이전트(Coding Agent)에서는 기술 설계서, 전체 코드베이스, 안내문, 도구 호출 결과 등 다양한 정보가 동시 탑재될 수 있음
컨텍스트 관리가 복잡해지므로, 올바른 구조와 전략이 필수적임

MCP(모델 컨텍스트 프로토콜)를 통한 외부 정보 및 도구와의 표준화된 상호작용 지원

MCP는 외부 시스템(예: GitHub, Sentry 등)과 Claude 사이의 상호작용을 표준화하여 더욱 유연한 컨텍스트 확보를 가능케 함
개발자 / 에이전트가 단순히 입력 프롬프트 내 정보만 볼 수 있는 한계를 벗어나, 외부 도구와 데이터 소스에 능동적으로 접근 가능
Claude Code도 MCP를 통해 외부에 분산된 기능/정보를 통합적으로 활용함

메모리 툴 도입으로 컨텍스트 바깥 정보의 저장 및 필요시 재활용을 실현함

Claude는 메모리 툴을 활용해 ‘윈도우 밖’의 정보를 저장(파일 시스템 기반, 클라이언트 소유)하고, 필요시 이를 다시 불러올 수 있음
예: 코드베이스 패턴, Git 워크플로우 선호도 등을 메모리에 저장해 필요할 때만 꺼내어 컨텍스트 창에 넣음
윈도우 내 공간 확보와 장기적 맥락 유지 문제를 동시에 해결함

컨텍스트 에디팅 기능으로 불필요 정보의 자동 제거 및 윈도우 효율성을 대폭 향상시킴

메모리는 외부에 저장, 컨텍스트 에디팅은 현재 창에서 불필요한 정보를 삭제(특히 오래된 툴 실행 결과)하여 공간 확보에 기여
주요 이유: 과거의 툴 결과 데이터는 크기가 크고, 세션 후반부에는 최신 맥락 형성에 비효율적일 때가 많음
Claude Code처럼 도구 호출이 수백 번 이뤄지는 상황에서 이 관리가 필수
Anthropic 내부 평가에서 메모리+컨텍스트 에디팅을 조합할 때 벤치마크 대비 39% 성능 향상 확인

대용량 컨텍스트 윈도우(최대 100만 토큰)와 동적 컨텍스트 최적화로 Claude의 잠재력을 극대화함

일부 Claude 모델에서는 100만 토큰에 이르는 초대형 컨텍스트 윈도우 지원
대용량 윈도우 내에서 어떤 정보를 언제 채우고, 비우고, 불러올지에 대한 최적화 툴을 병행 제공
Claude가 “컨텍스트 창”의 여유 공간 여부, 정보 품질 등을 스스로 파악하고 맥락에 맞는 응답을 하도록 설계됨

Claude에게 컴퓨터(실행 환경)를 할당하여 에이전트의 자율작업 능력을 획기적으로 강화함

“Claude에게 컴퓨터를 주고 원하는 작업을 맡긴다”는 패러다임이 핵심
최근 논의가 많은 에이전트 하니스(harness, 작업 프레임워크) 설계와 관련, 무거운 스캐폴딩이 아니라 Claude 스스로 코드 작성-실행을 한 번에 하도록 함
실행 인프라, 보안, 도메인별 전문성 연결 등이 병렬로 필요

안전한 샌드박스 환경에서의 코드 실행 능력(API 상의 Code Execution Tool 제공)으로 실무 적용성을 높임

Claude의 코드 실행 능력은 사용자가 직접 환경을 신경쓰지 않고, Anthropic 플랫폼이 컨테이너, 보안, 세션 관리 등을 책임짐
Claude Code 웹/모바일 버전이 런칭되면서, 사용자가 접속을 종료해도 백그라운드에서 코드를 실행·유지함
예시: “애니메이션에 스파클 이펙트를 추가해줘”와 같은 명령을 Claude가 작성하고 즉시 실행함

Agent Skills(스킬) 도입으로 도메인별 전문성 자동 확장 및 실제 문제 해결력을 부여함

Skills는 스크립트, 설명서, 리소스 폴더 등의 형태로 사전에 정의된 능력 묶음임
Claude는 요청 및 Skill의 설명에 따라 필요한 스킬을 판단, 샌드박스 환경에서 실행함
Skills와 MCP(외부 도구 및 데이터 접근)를 결합해, 단순한 답변이 아니라 실제 업무 처리가 가능한 에이전트 완성
예시: 웹 디자인 Skill 활용 시, 신제품용 랜딩 페이지를 사내 디자인 시스템 기준에 맞춰 자동 생성

플랫폼 지속 업그레이드와 개발자 지원을 약속하면서 Anthropic 팀 확대를 알림

플랫폼 발전 방향: Claude가 새로운 능력 또는 기존 능력을 심화할 때마다 API/인프라도 진화시켜 최첨단 성능 활용을 도모
메모리/컨텍스트 혁신, 에이전트 인프라·보안 샌드박스, 대규모 오케스트레이션 등 실질적 문제에 대한 지속적 개선 추진
Anthropic은 개발자 친화 제품, 인프라, 엔드 프로덕트 디자인, Devril 등 전 분야에서 팀원 채용 중임을 알림