영상 링크: Building Cursor Composer – Lee Robinson, Cursor
채널명: AI Engineer
Cursor Composer 구축 – 실제로 빠르고 똑똑한 소프트웨어 엔지니어링 에이전트 만들기 핵심 요약
- 본 영상은 Cursor의 엔지니어링/리서치 팀을 대표해 Lee Robinson이 ‘Cursor Composer’ 에이전트 모델의 개발 과정과 구조, 기술적 도전, 실제 운영 경험을 상세히 설명함.
- ‘Cursor Composer’는 실사용 소프트웨어 엔지니어링을 목표로 고속(속도)과 높은 지능(스마트)을 동시에 추구하며, 내부 벤치마크 측정에서 오픈소스 최고 모델들보다 우수, Frontier(최신 상용) 모델에 근접하는 성능을 가짐.
- 토큰 생성 효율성은 동급 지능 모델 대비 약 4배 뛰어나며, 이는 병렬 툴 호출, 자체 시맨틱 서치 도구 등의 인프라 및 아키텍처 개선 덕분임.
- Cursor 팀은 기존 탭(Tab) 오토컴플리트 모델 경험을 확장, 저지연성 코딩 에이전트를 위한 RL(강화학습)과 병렬 도구 호출을 도입하여 ‘빠르고 똑똑한’ 사용성을 목표로 삼음.
- 실제 Cursor 서비스 환경과 동일한 환경에서 RL 학습·검증을 반복하는 인프라 구축에 집중, 여러 VM(가상 머신) 클러스터와 서버, Custom 커널 등 대규모 분산 학습 시스템을 개발함.
- 모델 에이전트는 ‘파일 읽기/편집’, 코드베이스 검색, 린트, 터미널 명령 등 약 10개 툴을 상황에 맞게 병렬·직렬로 호출하여 코딩을 자동화함.
- 자체 임베딩 모델을 활용한 시맨틱 서치를 통해 파일 찾기 및 편집 추천 정밀도가 올랐으며, 실험에서 Composer뿐 아니라 모든 Cursor 에이전트 성능이 개선됨을 확인.
- Composer 전체의 RL 학습 및 실제 운영 경험을 통해 모델이 불필요한 수정은 줄이고, 더 효과적으로 코드 검색/이해/작업 단계를 스스로 개선하는 모습을 보임.
- 인프라 속도를 위한 저정밀 학습(Custom 커널) 및 멀티스레드 작업 분산, VM 오케스트레이션 등의 엔지니어링 과제가 모델 성공의 핵심으로 작동함.
- 최종적으로 2.0 버전 공개 한 달만에 많은 이용자가 긍정적 반응을 보였으며, “코딩 에이전트의 새 프로그래밍 경험(동기적, 실시간, Flow 유지)“을 제공함을 강조.
세부 요약 - 주제별 정리
Cursor Composer 모델은 빠르고 실제로 쓸 수 있는 코딩 에이전트를 목표로 개발되었음
- Cursor Composer는 실세계 소프트웨어 엔지니어링을 위해 설계된 최초의 에이전트 모델임.
- 핵심 목표는 “빠르면서도 똑똑하게” 실사용 환경에서 코딩을 지원하는 것이었음.
- 내부 벤치마크에서 오픈소스 최고 모델(예: StarCoder, DeepSeek 등) 대비 뛰어난 성능을 보이며, Frontier 계열 모델(GPT-5.1 Codex, Sonnet 45 등)과 유사하지만 약간 아랫단에 위치함.
- 토큰 생성 속도는 유사 지능 모델 대비 약 4배 빠름(효율성 중점 설계).
- 모델 개발은 “속도와 스마트함 모두 필수”라는 실사용자 피드백에 기반했음.
RL(강화학습)과 Cursor 실서비스 환경을 일치시키는 것이 학습 품질 제고의 핵심이었음
- RL(강화학습)을 적용, 실제 Cursor 서비스와 최대한 같은 환경에서 모델을 반복적으로 테스트하고 개선함.
- 학습 시 실제 Cursor 툴 사용 시나리오(파일 읽기, 편집, 검색, 린트, 터미널 명령)를 벤치마크로 삼음.
- 사용자 질의에 대해 에이전트가 상황에 따라 직렬 또는 병렬로 여러 도구를 호출함.
- RL을 통해 다양한 Tool 사용 조합을 실험하며, 최적 출력 결과에 따라 모델 파라미터를 갱신함.
대규모 학습 환경 구축 과정에서 속도 및 일관성 등 인프라 측면의 세 가지 난제를 경험함
- 첫째, “학습-추론 환경 일치”가 필요한데, 병렬화·샘플링 환경의 차이 극복이 필요함.
- 둘째, 실제 데이터 기반 롤아웃(rollout)은 수십만
수백만 토큰, 수백수천 번의 Tool 호출 등 매우 복잡해짐. - 셋째, 프로덕션과 동일한 Tool 포맷/반환 값 일치와 Burst성(일시 과부하) 컴퓨팅 문제(실제 운영 vs 훈련 환경 차이).
- 이 세 가지 모두 모델링이 아니라 인프라 엔지니어링, 시스템 오버헤드 해결이 핵심임.
분산 서버 아키텍처와 커스텀 저정밀 학습 커널로 대규모 빠른 학습이 가능해졌음
- 세 개의 주요 서버(트레이너, 추론 서버, 환경 시뮬레이터)로 분산 아키텍처를 구성함.
- PyTorch 기반 표준 ML 스택, Ray 프레임워크를 활용한 rollout 관리, 실제 서비스 환경 시뮬레이션 서버가 모두 통신하며 상호작용함.
- 자체 개발한 저정밀(custom) 커널 라이브러리를 통해 Mixture of Experts layer 학습 속도를 Nvidia Blackwell 칩 기준 약 3.5배 향상시킴.
- 환경 서버 간 작업 부하 분산(Load balancing) 처리로 작업 대기시간/버림 시간 최소화.
VM 기반 클라우드 환경이 RL 학습 및 실제 제품 운영 모두에 핵심 기반이 되었음
- Cursor의 Cloud Agents 제품(에이전트를 웹/모바일/Slack 등에서 구동)은 각 사용자의 코드를 VM(가상머신)에 로드, 보안 샌드박스에서 파일 편집/툴 실행을 가능케 함.
- 이 클라우드 VM 인프라는 RL 학습 데이터 환경을 실제 서비스와 동일하게 맞추는 데 이상적임.
- 실서비스 및 학습 환경 모두 다수의 클러스터, 수십만 VM 오케스트레이션 필요 — 이를 위한 대시보드 및 관리 툴 개발.
- 훈련 워크로드의 Burst성(Burst workload) 문제, VM 간 작업 분배 등 인프라 과제 해결이 병행됨.
시맨틱 서치와 자체 임베딩 모델이 모델 성능 상승에 결정적인 역할을 함
- 자체 임베딩 모델을 훈련, 시맨틱 서치를 통해 코드베이스를 인덱싱하여 자연어 입력 기반 파일 검색 기능을 구현함.
- 실험 결과 시맨틱 서치는 Composer를 비롯한 Cursor 에이전트 전체에서 성능 향상 효과가 극대화됨.
- 환경 일치(동일한 도구셋·포맷)와 시맨틱 서치 습득이 모델의 “파워유저”화에 기여함.
RL 학습 과정에서 모델이 실제 에이전트다운 행동을 스스로 습득해 나감
- RL을 반복하며 성능이 점진적으로 향상, 최종적으로 Frontier 급 코드 에이전트 성능에 가까워짐.
- 불필요한 코드 수정(Over-editing) 빈도 감소, 충분한 코드 검색/분석 후 최적 위치에만 수정을 수행하는 식으로 행동 변화가 나타남.
- 툴 병렬 호출(예: 파일 10개를 동시에 읽기 등)이 Composer의 속도를 실제로 크게 높임.
- 모델이 진짜 “에이전트”답게 문제를 파악·수행하는데 적응하는 모습이 데이터로 확인됨.
2.0 버전 런칭 및 도입 이후 사용자 프로그래밍 경험이 근본적으로 변화함
- Composer 1을 탑재한 Cursor 2.0 출시 이후, 실제로 많은 사용자가 시연 및 실사용에 긍정적 피드백을 제공함.
- 과거(초기 코딩 에이전트 시절)에는 “비행기 와이파이처럼” 느려서 불만이 많았으나, Composer는 동기적(실시간), 사용자의 flow를 유지하는 방식으로 “직접 코드 작성을 하던 시절”에 가까운 경험을 제공하게 됨.
- 최신 Frontier 모델(GPT 5.1 Codex 등)로 플랜을 세우고, Composer로 구체적 구현을 빠르게 진행하는 등 “새로운 프로그래밍 워크플로우”를 지원.
RL 및 인프라 고도화가 특화 코딩 모델의 품질 및 팀 생산성 전체에 긍정적 파급효과를 가져옴
- RL(강화학습)은 충분한 데이터, 적정 컴퓨트 투입 시 특화 모델에 매우 효과적임이 입증됨(AGI 지향 아님).
- Cursor 자체도 Cursor를 활용해 모든 엔지니어링/리서치 생산성을 크게 높이고 있음.
- 인프라 개선과 ML(머신러닝) 연구의 경계가 실제 개발에선 매우 밀접하게 맞닿아 있음(버셀에서의 경험과 유사).
Composer 개발에서 얻은 핵심 교훈은 데이터 품질·인프라·환경 일치의 중요성이었음
- 다양한 ML 연구와 데이터 설계의 성공적 적용은 대규모 신뢰할 수 있는 인프라 없이는 불가능함.
- 실제 운영 환경과 학습 환경의 일치가 모델 품질에 직접적 영향을 미침.
- 코딩 에이전트의 미래는 보다 동기적이고 빠르며, 실세계 문제해결에 밀착한 “flow 지원” 방식임을 강조.
커서에서는 최고 코딩 모델 개발을 위한 인재 채용도 적극 진행 중임
- 뉴욕 등에서 사무실을 오픈, 모델 연구 및 엔지니어링 전 분야로 채용 확대 중임(영상 후반 언급).
- 최고의 코딩 모델 개발 및 실제 적용에 관심 있는 사람이라면 팀에 합류할 것을 권유함.