영상 링크: Defying Gravity - Kevin Hou, Google DeepMind
채널명: AI Engineer
중력을 거스르다 - Google DeepMind의 Kevin Hou 발표 핵심 요약
- 영상은 구글 딥마인드에서 개발한 새로운 AI IDE인 ‘안티그래비티(Antigravity)’의 소개와 그 철학, 구현 방식, 실제 사용자 경험, 그리고 이를 가능하게 한 기술적 진화에 대해 설명함
- 안티그래비티는 에디터, 브라우저, 에이전트 매니저(Agent Manager)의 세 가지 주요 ‘서피스’를 중심으로 운영되는 개발 플랫폼임
- 이 제품은 “에이전트 지향(Agent First)”을 핵심 철학으로, 기존 코드 중심 IDE에서 한 단계 높은 추상화인 에이전트 중심 환경 제공을 목표로 함
- 브라우저는 에이전트가 실제 사람처럼 웹을 탐색하고, Google Docs, GitHub 등 여러 시스템과 연동해 조작·테스트·자료수집을 할 수 있도록 설계됨
- 에이전트 매니저는 여러 에이전트를 동시에 체계적으로 관리하며, 중요 알림이나 명령어 실행 승인 등 OS수준의 알림 기능 포함
- AI 모델(특히 Gemini 3 Pro, Nano Banana 등)의 발전이 소프트웨어 개발 도구 패러다임을 단계적으로 변화시킨 배경 설명: 오토컴플릿→챗→에이전트→동적 아티팩트로 진화
- 안티그래비티의 핵심 혁신은 ‘아티팩트(Artifact) 시스템’으로, 에이전트가 진행 과정·설계·실행 결과를 동적 시각화로 제공해 개발 흐름을 투명하게 만듦
- 구글 딥마인드 내에서 제품·연구자가 실제로 매일 사용하는 경험 기반 ‘리서치-프로덕트 선순환’ 구조를 강조하며, 빠르고 현실성 있는 기능 개선이 이뤄진다고 설명함
- 다양한 사용자 피드백 및 내부 피드백을 토대로 Parallelism(병렬 작업), 자동화, 알림, 다양한 리뷰 및 협업 기능이 구현되어 있음
- Kevin Hou는 향후 AI 기반 IDE, 에이전트, 멀티모달 시스템의 결합이 개발자의 업무 형태를 근본적으로 혁신할 것임을 피력
세부 요약 - 주제별 정리
안티그래비티는 기존 IDE의 패러다임을 뛰어넘는 ‘에이전트 주도형’ 플랫폼으로 설계됨
- 안티그래비티(Antigravity)는 구글 딥마인드의 첫 에이전트 지향 AI 개발 환경(IDE)으로, Gemini 3 Pro와 동시에 공개됨
- IDE라기보다 ‘AI 개발 플랫폼’에 가까우며, 1) 에디터(편집기), 2) 브라우저, 3) 에이전트 매니저라는 세 가지 UI로 구동됨
- ‘에이전트’가 개발 환경의 핵심 주체로, 기존의 코드 레벨 작업·파일 단위 변경을 넘어 한 단계 높은 레벨에서 전체 업무 컨텍스트를 처리
- 사용자는 IDE의 여러 인터페이스(에디터, 브라우저, 매니저)를즉각적으로 전환(100ms 미만)할 수 있고, 필요한 경우 명령어(⌘E/ctrl+E)로 신속히 이동 가능
- 에이전트 매니저 창에서는 프로젝트와 에이전트, 작업 히스토리에 대한 총괄적 관찰 및 컨트롤이 이뤄짐
에이전트 매니저는 병렬적 멀티태스킹 및 에이전트 관리의 허브 역할을 수행함
- 에이전트 매니저는 사용자가 여러 에이전트를 동시에 관리하도록 설계되었으며, 각 에이전트의 상태·진행도를 한눈에 확인 가능
- ‘인박스’ 기능을 통해 실행 대기 중이거나 승인(예: 중요 터미널 명령) 등의 사용자 상호작용이 필요한 작업을 표기
- OS 수준의 알림 시스템이 내장되어 있어, 중요한 이벤트∙작업을 즉각적으로 사용자에게 전달함
- 다수의 프로젝트 혹은 세부 태스크가 동시에 발행·관리될 수 있도록 병렬 구조와 오케스트레이션 기능이 탑재됨
안티그래비티의 에디터와 브라우저는 ‘에이전트 중심’ 사용방식을 강화함
- 에디터는 ‘에이전트 사이드바’를 갖춰, 일반 에디터(예: VS코드 포크)에 더해 에이전트와의 실시간 연동이 가능
- 브라우저는 크롬 기반으로, 에이전트가 직접 브라우저를 제어(클릭∙스크롤∙JS 실행 등)하며 실제 웹 테스트와 컨텍스트 자료 수집이 가능
- 웹 인증 정보(예: 구글 문서, 깃허브 등) 직접 연동을 통해 실제 업무에 쓰이는 자원에 접근 가능
- 코드 변경(diff)뿐 아니라, 브라우저 내에서의 실제 동작 과정을 청색 마우스 포인터 등으로 실시간 녹화해 ‘검증 가능성’ 제고
AI 모델 혁신(특히 Gemini 3) 덕분에 ‘멀티모달’, ‘장기지속태스크’, ‘도구 사용’ 등이 비약적으로 향상됨
- 코파일럿 시절(단기 자동완성)→챗(RHF 기반 질의응답)→에이전트(복합 업무 자동화)→멀티모달 및 도구 제어 순으로 진화
- Gemini 3 Pro, Nano Banana 시리즈는 지침 따르기·도구 조합 사용·장기 작업 관리 등에서 우수한 성능
- 에이전트는 웹 브라우저에서 복잡한 자바스크립트 테스트, 인증/데이터 수집, 연속적/분기적 업무 실행 모두 가능
- 멀티모달 능력(이미지 생성/분석, 구조 다이어그램, 녹화 등)이 강화되어, 개발 업무의 시각적 결과까지 자동 처리
브라우저 액세스와 인증·검증 기능이 소프트웨어 개발자 경험에 새로운 차원을 더함
- 에이전트는 브라우저에서 실제 엔지니어처럼 DOM 조작, 버튼 클릭, 스크롤, 화면 녹화 등 물리적 행위를 자동화
- 개발자는 단순 코드 diff가 아니라 실제 웹/앱 동작 화면 녹화(스크린레코딩)로 변경사항을 검증할 수 있음
- 예시로, 플라이트 트래커 앱에서는 에이전트가 화면을 조작해 결과를 도출하고 이를 녹화본으로 제공
- 이미지 이해 능력을 결합해, 실행결과에서 다시 피드백/반복작업이 가능하도록 진화
이미지 생성/이해와 멀티모달 협업 기능이 개발 과정에 자연스럽게 융합됨
- Gemini 및 Nano Banana 모델들로 오랜 기간 실험하며, 이미지 기반 코드 설계·다이어그램·모형화/Mockup 지원을 강화
- 개발자는 이미지 기반으로 모형을 만들며, 에이전트와의 코멘트/피드백 루프 내에서 설계 반복 가능
- GitHub 스타일 코멘트·Figma 스타일 주석 등 다양한 협업 인터페이스가 도입
- 에이전트는 이미지 주석, 순차적 피드백, 자동 반영을 통해 디자인 목업부터 실제 구현까지 매끄럽게 연결
‘아티팩트’ 시스템은 동적이고 시각적인 에이전트 산출물 관리의 새로운 기준을 제시함
- 아티팩트(Artifact)는 에이전트가 작업 중 생성하는 동적 정보의 시각적 결과물(예: 계획서, 다이어그램, 스크린샷, 녹화 등)을 일컫음
- 텍스트 대화(토큰 스트림)에만 의존했던 과거 방식의 비효율과 혼동을 해결하기 위해 도입됨
- 사용자는 각 단계에서 생성된 시각적 아티팩트를 통해 작업 진행상황·분기·오류·최종결과 등을 효과적으로 추적 가능
- 마크다운 문서, 액션플랜, 아키텍처 다이어그램, 튜토리얼형 워크스루 등 다양한 타입의 아티팩트가 자동 생성
- 모델이 작업의 복잡성·필요성에 따라 유형·주체·공유범위(예: 서브에이전트/메모리/타 대화) 등을 결정
아티팩트와 코멘트 기반 인라인 피드백 시스템이 협업 및 반복개선 루프를 촉진함
- 사용자는 문서/이미지 내 상세 영역마다 인라인 코멘트, 제안, 수정 요청 등 개발자 사이의 협업 방식처럼 직접 피드백 제공 가능
- Google Docs, GitHub에서 영감받은 주석·리뷰·코멘트 시스템이 구현되어, 실제 업무 협업과 유사한 경험 제공
- 이미지 기반 디자인에서는 Figma와 유사한 하이라이트·코멘트 기능이 적용되어, 비정형 모달리티에서도 통일된 피드백 루프 형성
- 에이전트는 수신한 피드백을 중간 작업 단계에서도 반영, 알림 후 작업 지속이 가능하도록 구조화
‘에디터와 아티팩트 매니저의 자유로운 전환’으로 신뢰도와 생산성 모두 제공
- 완전 자동화를 아직 신뢰하지 못하는 개발자들을 위해 언제든지 (명령어 한 번에) 에디터로 진입 가능하도록 설계
- 에이전트가 80%까지 자동화 진행 후, 나머지 세밀한 디자인/디버깅을 사람이 코드 에디터에서 직접 처리할 수 있음
- 에디터로 진입 시 해당 대화·파일·아티팩트가 즉시 세팅되어, 사용자는 문맥을 놓치지 않고 작업 이어가기 가능
구글 딥마인드의 ‘리서치-프로덕트 피드백 선순환’이 급속 성능 향상 및 신속 기능 적용을 주도함
- 안티그래비티는 구글 내부 연구자, 엔지니어들이 매일 업무에 실사용하며 피드백을 제공하도록 설계
- 실제 사용 경험에서 모델·인프라의 한계(예: 처리 속도, 데이터 분포 문제, 도구 상호운용성 등)를 신속히 발견·개선
- 연구팀과 제품팀이 좌석 수십 피트 거리에서 긴밀히 협업하며 API 변경·에이전트 구조 개선·아티팩트 기능 강화 신속 반영
- 예시: Computer Use 모델-프론트엔드 연동, 아티팩트의 체계적 리뷰 설계 등에서 실시간 협력 진행
- 이 구조 덕분에 안티그래비티는 최신 AI 연구 성과와 혁신적 IDE 기능을 동시 전달하는 가장 진보된 개발 도구로 자리매김
‘가능성의 상한선(ceiling)’을 올리고, 앞으로의 소프트웨어 개발 방식을 근본적으로 변화시키는 것을 목표로 함
- 딥마인드와 구글의 여러 팀이 도전적인 문제(브라우저 사용, 멀티모달, 장기지속 및 추론 등)에 집중, 미래형 개발 환경 비전을 제시
- 컴퓨터 사용 능력, 멀티모달 콘텐츠, ‘아티팩트’를 통한 대화의 시각적 구조화 등은 미래 개발자 업무의 새로운 표준이 될 것으로 전망
- Kevin Hou는 안티그래비티의 핵심 혁신 요소로 ‘에이전트 중심 경험’, ‘아티팩트 및 피드백 체계화’, ‘리서치-제품의 동기화’라는 세 가지를 강조
출시 과정에서 직면한 기술적/운영적 한계와 이를 극복하기 위한 노력
- Gemini 3 Pro, Nano Banana 등 최신 모델과 함께 빠르게 공개하였으나 글로벌 칩/서버 자원 부족 등으로 서비스 용량 부족 문제 발생
- 엔지니어링 팀이 24시간 대응 중임을 언급하며, 조속한 문제 해결을 약속
- 사용자 피드백을 외부(트위터 DM 등)로 수용하고 있으며, 기능 개선·에러 최소화에 지속 투자 중임
결론적으로, 안티그래비티는 에이전트+멀티모달+협업적 피드백 시스템이 결합된 미래 지향형 AI 개발 환경임을 자신 있게 제시
- 안티그래비티 팀은 이번 공개를 사용자와 공유하게 되어 매우 기쁘며, 제품의 발전과 시장 확대에 강한 의지를 표명
- 개발자와 협업자가 실제 사용/피드백을 통해 안티그래비티가 더 발전할 수 있음을 강조
- 미래 소프트웨어 개발 방식의 상한선을 끌어올리는 핵심 플랫폼이 되고자 함