
영상 링크: Windsurf everywhere, doing everything, all at once - Kevin Hou, Windsurf
채널명: AI Engineer
윈드서프: 어디서나 모든 것을 동시에 하는 소프트웨어 엔지니어링 에이전트 핵심 요약
- 본 영상은 Windsurf의 프로덕트 리드 Kevin Hou가 AI Engineer Worlds Fair에서 발표한 세션으로, Windsurf가 지난 1년간 어떻게 급성장했는지 소개함
- Windsurf는 코드 자동완성에서 출발하여, 병렬 AI 에이전트, 웹 검색, MCP 지원, 자동 메모리 생성, 배포 등 10개의 혁신(‘웨이브’)을 빠른 속도로 도입함
- 현재 Windsurf는 전 세계 수백만 명의 사용자가 활용하며, 하루 9천만 줄 이상의 코드와 분당 1000건 이상의 메시지를 생성
- Windsurf의 핵심 비결은 “인간과 AI가 공유하는 타임라인”으로, 사용자와 AI가 모든 작업 히스토리를 공유함으로써 실제로 사용자의 생각을 읽는 듯한 경험 제공
- 개발자 작업은 IDE(코드 편집기) 내부 뿐 아니라 외부(GitHub, Google Docs, Figma, Jira, Notion, Stripe 등)에서 이뤄지므로, Windsurf는 다양한 컨텍스트와 워크플로우를 통합해 지원
- AI는 코드 작성 뿐 아니라, 터미널 명령 실행, 디자인 문서 작성, 배포, 분석, 외부 서비스와의 연동 등 개발자의 전체 태스크를 대행하도록 진화 중
- Windsurf의 AI 활용 비중은 현재 약 80
90%가 자동 에이전트, 1020%가 인간 주도이며, 궁극적으로 99%까지 에이전트 자동화가 목표 - 이러한 광범위한 워크플로우 자동화를 위해 Windsurf는 자체 소프트웨어 엔지니어링 특화 모델 ‘SUI 1’을 도입, 대형 경쟁 모델에 근접한 품질을 소규모 팀으로 달성
- ‘SUI 1’은 전체 태스크 완료형 및 대화형 업무 투입형 두 가지 벤치마크로 평가되어, 실사용 엔지니어의 행동 양식에 최적화된 성능을 입증
- Windsurf는 커뮤니티 피드백 기반 데이터 플라이휠 구조로 지속적인 에이전트·툴 개선, 도메인 특화 모델 고도화를 반복 추구
세부 요약 - 주제별 정리
Windsurf는 지난 1년간 엄청난 속도로 혁신을 거듭하며 수백만 명의 개발자들에게 선택받음
- Windsurf 출시 6개월 만에 글로벌 수백만 사용자 돌파
- 하루 90,000,000 줄의 코드, 분당 1,000건 이상의 메시지 생성 기록
- 제품 런칭 초기 이름은 ‘Kodium’이었으나, ‘혁신적인 변화의 물결’을 반영하여 ‘Windsurf’로 리브랜딩
- 10회에 걸쳐 주요 기능 혁신(‘웨이브’) 도입: 웹 검색, MCP(Multi-Contextual Programming) 지원, 자동 메모리, 배포 자동화, 병렬 에이전트 등 포함
- AI Engineer Worlds Fair에 재참석하며, 업계 변화의 속도를 “바다 위 카이트에 올라탄 느낌”에 비유
Windsurf의 차별점은 인간과 AI가 실시간으로 타임라인을 공유한다는 점에 있음
- “AI와 인간이 공유하는 타임라인”이 제품의 핵심 ‘비밀 소스’
- 개발 작업 및 편집 히스토리 등 모든 행동을 AI와 인간이 실시간 공유함으로써, 사용자 의도를 잘 파악하는 느낌 제공
- 과거(자동완성 전)는 사용자가 모든 코드를 직접 작성해야 했으나, Copilot 등 출시 이후 일부 작업만 AI가 수행
- Windsurf 에이전트와 에디터 도입 이후, 다수 파일 동시 편집, 대규모 파일 배경 분석, 터미널 명령 실행 등 AI의 역할 확장
진정한 개발자 워크플로우 지원을 위해 IDE를 넘은 전방위 컨텍스트 수집이 필요함을 강조
- 개발자의 실질적인 워크플로우는 IDE(편집기) 내외에서 모두 발생함
- 주요 컨텍스트 영역:
- 코드 및 파일 편집, 터미널 명령, 에디터 내 히스토리, 오픈 탭 등(내부)
- GitHub 커밋/PR 히스토리, 온라인 검색, 문서 탐색 등(외부)
- 메타러닝: 조직별 엔지니어링 규칙, 선호, 코드 품질 기준(조직 문화적 차별화)
- 예시로 ‘데이터 시각화 대시보드 신규 페이지 개발’ 전체 프로세스를 제시:
- Slack에서 요구사항/고객 요청 수집
- Google Docs에서 디자인 문서, 인프라 설계 작성
- Jira로 티켓 관리
- Figma에서 디자인 제작
- 코드를 Windsurf 에디터에서 작성
- Pull Request(PR), 코드 리뷰, 메인 브랜치 머지, 배포 및 분석 진행
Windsurf는 다양한 외부 서비스·툴과 광범위하게 통합되어 실무를 지원함
- Google Docs, Figma, Notion, Linear, Stripe 등 업무에 쓰이는 주요 SaaS·문서툴과 1클릭 연동
- 사용자 업무 맥락을 API 등으로 실시간 연동해 코드 제안 및 문서 생성에 반영
- Windsurf 팀은 지난 10회의 ‘웨이브’를 통해 제품의 ‘유비쿼터스화’에 집중
AI는 코딩을 넘어 다양한 개발·운영 태스크를 직접 처리하는 수준에 도달하려 함
- 단순 코드 작성뿐 아니라 아래와 같은 전 과정을 자동화 지향:
- 코드베이스 관련 터미널 명령 실행 (자동 실행 vs 사용자 승인 필요 구분)
- 브라우저 미리보기/DOM 조작/콘솔 확인 등 ‘개발자와 동일한 웹 테스트’
- GitHub MCP와 연동해 PR 생성, 기존 PR 문맥 적극 반영
- 자동 코드리뷰/코멘트/테스트 플랜 작성 (Windsurf Reviews 출시)
- Netlify와 1클릭 배포 서비스(에이전트 배포 지원)
- “개발자가 할 수 있는 일의 거의 모든 것”을 AI가 대행하는 것이 목표
중장기적으로 Windsurf는 개발 워크플로우 대부분을 AI가 자동화하는 세계를 지향함
- 현재: 약 80
90%는 에이전트(자동화), 1020%는 인간 개입(workflow상) - 궁극적으로 99% 에이전트, 1% 사용자 최종 승인 비율로, 거의 전체 주기를 무인화
- 실시간 에이전트 작동 + 백그라운드 리서치 + 사용자 “승인요청”만 최소화하는 프로세스 설계
- 어떤 상황(침대, 화장실, 버스, 음성비서 기기 등)에서도 코드를 작성할 수 있는 환경 구축 목표
’타임라인’ 문제를 해결하기 위해 범용 LLM이 아닌 자체 소프트웨어 엔지니어링 특화 모델을 개발함
- 기존 LLM(GPT, Gemini 등)로는 복합적/미완성 중간 작업 연결, 다양한 툴/외부 서비스 제어에 한계
- Windsurf는 자체 워크플로우/타임라인 구조에 맞춘 ‘SUI 1’(SW Engineering Model) 개발
- 단순 코드 생성이 아니라 전주기 소프트웨어 엔지니어링을 위한 모델로 설계
- Frontier(최첨단) 모델에 근접한 성능을 소수 인원으로 구현
SUI 1 모델은 실무형 엔지니어링을 위한 벤치마크와 대화형 투입 평가로 품질을 입증함
- 오프라인 평가 벤치마크 2종 활용:
- End-to-end Task Benchmark: 특정 목적을 가지고 시작 코드베이스~최종 테스트 통과까지 완성하는 능력
- Conversational Suite Task Benchmark: 사용자의 중간 대화/부분완료 상태에 투입되어 보조하는 능력
- Windsurf 이용자의 실무적 행태(중간 개입, 복잡한 워크플로우)와 높은 매치
- 평가 결과 도움, 효율성, 정확성에서 높은 통합 점수 확보
- 소수 인원의 개발팀으로도 Frontier 모델 품질 달성
Windsurf의 강점은 실제 개발자 커뮤니티 중심 데이터 플라이휠 구조에 있음
- 사용자들이 실제 개발 태스크에서 상용 모델(SUI 1, GPT-3.5, 3.7 등) 중 SUI 1 선택 비중 증가
- 발생하는 엄청난 사용 피드백(thumbs up/down, accept/reject 등)을 통해 실제 프론티어 개발자 요구 파악
- 반복적인 데이터 → 툴/모델 개선 → 더 나은 제품 출하 → 사용자 업스킬 → 데이터 추가로 이어지는 플라이휠 선순환
- SWEBench 등 기존 평가 기준이 아닌 진짜 소프트웨어 엔지니어링 프론티어를 겨냥
Windsurf의 실제 개발·운영 모델은 2025년의 차세대 AI 프로덕트의 표본임
- 소규모 팀, 한정된 자원임에도 데이터-애플리케이션-모델의 ‘조화’로 Frontier 품질 구현
- 모델, 데이터, 애플리케이션 각 요소가 실사용자 행동과 밀접하게 연계(사용자 로그, task flow 등)
- Windsurf의 방향성은 “모든 곳에서, 무엇이든, 동시에” 수행하는 차세대 소프트웨어 개발 AI임