영상 링크: From Arc to Dia: Lessons learned building AI Browsers – Samir Mody, The Browser Company of New York
채널명: AI Engineer
Arc에서 Dia까지: AI 브라우저 구축 과정에서 얻은 교훈 핵심 요약
- 브라우저 컴퍼니 오브 뉴욕(BCNY)은 2019년에 설립되어, 기존 브라우저의 한계를 넘어 현대 인터넷 사용 방식에 맞는 브라우저 개발을 목표로 시작됨.
- 첫 제품 Arc(2022)는 기존 브라우저 대비 개인화·조직화·사용자 경험 향상을 제공했으나, 궁극적인 비전을 달성하지 못했다고 평가.
- 2022년 대형 언어 모델(LLM: GPT 등) 접근성이 커지며, AI 기능 프로토타이핑 및 통합을 시작함.
- 2024년 ‘Act 2’ 동영상을 통해 “AI가 인터넷 사용 방식과 브라우저 자체를 근본적으로 바꿀 것”이라는 회사의 논지를 공개.
- Arc의 경험을 바탕으로, AI 본연의 속도와 보안을 염두에 두고 제로베이스에서 Dia 브라우저(2024)를 개발 및 출시함.
- Dia는 사용자의 업무 맥락을 이해하고, 탭과 앱 활용을 돕는 맞춤형 AI 어시스턴트 기능을 제공.
- 빠른 반복개발 및 혁신을 위해 프로토타입 툴, eval 시스템, 데이터 수집, 자동화 등 내부 도구 체계화에 투자.
- Jepa 같은 자동 프롬프트 최적화 기법을 활용하여 LLM 프로덕션 품질과 기능을 지속적으로 고도화.
- 모델 행동 설계 전담팀을 신설하여, AI 어시스턴트의 성격·스타일·행동을 정교하게 설계하고 조직 내 누구나 직접 프롬프트를 개선할 수 있는 환경을 마련함.
- AI 브라우저의 핵심 보안 위협인 프롬프트 인젝션 대응을 위해 기술적·디자인적·UX적 조치가 모두 통합된 구조를 지향.
세부 요약 - 주제별 정리
브라우저 컴퍼니의 설립 배경과 Arc의 출시가 기존 브라우저 시장에 던진 의미
- 브라우저 컴퍼니(BCNY)는 2019년 설립, “인터넷 사용 패러다임에 맞는 브라우저로의 재창조”를 신념으로 삼음.
- 당시 브라우저 소프트웨어는 수십 년간 사용 방식이 변해도 자체 변화가 거의 없어 혁신 필요성이 대두됨.
- 2022년 Arc 브라우저를 최초 출시, 더 나은 개인화, 정돈된 UI/UX, 장인정신 강조 등 차별화된 경험을 제공.
- Arc는 ‘더 나은 브라우저’라 평가받으며 수많은 팬을 확보, 지금도 수백만 명이 사용.
- 그러나 Arc는 시장 내 기존 브라우저 대비 “점진적 향상(Incremental improvement)”에 불과했음을 시인, 궁극적 비전과 괴리 존재.
LLM 도입이 BCNY의 제품 방향성과 비전을 재설정하게 만든 계기
- 2022년, GPT 등 LLM 등장과 API 개방으로 AI 기능 탐색 및 프로토타이핑을 즉각 개시함.
- Arc에 일부 AI 기능을 시범 도입하며, 단순 기능 확장을 넘어 AI 자체가 브라우저 구조와 사용방식에 혁신을 일으킬 것임을 인식.
- 2024년 초 ‘Act 2’ 유튜브 영상에서 “AI가 브라우저와 인터넷 사용법을 구조적으로 변화시킬 것”이라는 기업의 공식 비전 공개.
- 이 계기를 바탕으로, AI 최적화 설계를 기반으로 한 새로운 브라우저(Dia) 개발을 착수함.
AI 본연의 속도와 보안을 목표로, 제로베이스에서 새롭게 Dia 브라우저를 구축함
- 기존 Arc의 틀을 탈피, AI의 속도와 보안을 근간으로 Diaz를 ‘처음부터’(from the ground up) 설계.
- 2024년, AI 네이티브 설계의 Dia 브라우저를 론칭, 기존 제품과 아예 다른 구조 및 사용성을 지향.
- 모든 탭, 앱, 플로우에서 사용자를 ‘이해’하고 맥락 중심의 맞춤형 AI 어시스턴트가 실시간 업무 지원.
- 사용자의 과거 기록, 개인화된 워크플로우, 탭 및 앱 활용 도우미 등 다양한 AI 기반 기능 통합.
- 아직 회사의 궁극적 비전엔 미치지 못하지만, 목표 달성을 위한 중요한 진척임을 강조.
빠른 아이디어 실험과 반복개발을 위해 모든 도구와 프로세스를 사내용 소프트웨어로 내재화함
- “더 빨리 빌드하고, 더 빨리 출시하고, 더 빨리 학습하는” 속도를 핵심 경쟁력으로 삼음.
- 초기에는 엔지니어만 접근 가능한 ‘프롬프트 에디터’가 존재, 팀 내 한계와 느린 반복을 경험.
- 이후 사내 전 직원이 사용할 수 있는 프로덕트 내 툴(프롬프트, 모델, 컨텍스트·파라미터 관리 등)로 확장.
- CEO에서 신입까지 아이디어 제안, 실험, 개선 과정에 즉시 참여 가능.
- 메모리 지식 그래프, 컴퓨터 유즈 메커니즘 등 각종 프로토콜 최적화 도구를 모두 직접 도입 및 운영.
- 다양한 직군(PM, 디자이너, CS, 전략·운영 팀 등)이 각자 실제로 아이디어를 프로토타입, 실험할 수 있는 환경 조성.
Jepa 등 프롬프트 최적화 자동화 시스템 도입으로, LLM 기반 기능을 효율적으로 고도화함
- LLM 기능 개선, 특히 프롬프트 최적화를 위한 자동화 기법(Jepa 등)에 투자.
- Jepa는 RL(fine-tuning 등) 없이 ‘샘플 효율적으로’ 프롬프트를 개선하는 방법론임.
- 사용법: 초기 프롬프트 집합을 준비, 각종 과제에 적용·스코어링(평가) 실시.
- PA(Preference Aggregation) selection으로 최적 프롬프트 선정.
- LLM을 활용하여 피드백(반성) 및 새로운 프롬프트 자동생성 → 반복.
- 반사적(Reflective) 프롬프트 변이 기법, 선택(Selection) 확장 등의 혁신점.
- 텍스트(프롬프트)만 튜닝, 모델 파라미터(weight) 변경 불필요.
- 실제 Arc 및 Dia에서 단순 프로토타입 프롬프트도 Jepa로 품질 및 성능 고도화.
프로토타이핑·평가·자동화 등 빠른 기능 실험과 출시를 위한 단계별 개발 프로세스를 운용함
- 아이디어·프로토타이핑 단계: 누구나 쉽게 아이디어를 생성, 매주/매일 실험(‘at-bats’의 최대화).
- 사내 도그푸딩, 실제 유용성 및 품질 임계치 도달 가능성 평가.
- 진짜로 문제 해결 가능성(utility) + 고품질 목표 충족이 판단될 때 다음 단계 진입.
- 이후 평가 지표 수집·정교화, 코드·프롬프트·자동화(Jepa 등) 기반 반복적 개선.
- 내부 테스트 및 데이터 피드백 → 실제 제품 출시.
- 반복 가능·효율적인 선순환 구조 구축이 목표.
모델 행동 설계를 하나의 전문 공정으로 분리하여, 제품 품질을 체계적으로 높임
- 모델 행동(Model behavior)이란: 제품 내 AI가 보이는 행동·성격·스타일을 평가·정의·배포하는 과정.
- 원칙을 제품 요건(프롬프트, 평가, 사양 등)으로 구체화.
- 어시스턴트의 응답 스타일·톤·기능 단계별로 명확히 정의.
- 행동 설계(Behavior design), 데이터 수집·평가, 모델 스티어링(프롬프트/모델/컨텍스트 관리) 등 하위작업으로 분류.
- 반복적 방식: 개발→정제→새 평가→피드백 수집(내부·외부)→반영의 순환.
- 기존에는 단순 지시어/프롬프트 중심이었으나, 이제는 에이전트 행동 설계(목표지향적 추론, 자율적 작업, 자기교정·학습, 성격화 등)로 진화 중.
- BCNY는 “모델 행동”이 제품개발 내 핵심 기능화될 것이며, 점점 더 전문성과 중요성을 갖게 됨을 강조.
모든 팀원이 모델 행동을 설계할 수 있는 환경으로 전환하고 역할 경계를 허물어 혁신을 이룸
- 팀 내 엔지니어가 직접 프롬프트 작성하던 체계에서 내부 도구 확대 후 다양한 직군이 참여.
- 예시: 전략·운영팀의 구성원이 주말 동안 기존 모든 프롬프트 재작성, 월요일 동영상으로 결과 공유 후 제품 품질 및 경험 비약적 개선.
- 이러한 성공적 경험을 계기로 모델 행동 전담팀 신설.
- “누가 모델 행동을 설계할 적임자인가?”에 대해, 고정된 역할 관념 대신 칸막이 없는 협업·참여 방식을 지향함.
프롬프트 인젝션 등 AI 브라우저 보안 위협에 대해 기술과 UX를 아우른 복합적 대응 전략을 적용함
- 프롬프트 인젝션: 외부 컨텐츠(예: 웹 페이지)에 숨겨진 프롬프트가 LLM 명령을 오버라이드, 데이터 유출·악성 명령 실행·안전 규칙 무시 등의 피해를 유발.
- 예시: 요약 요청된 웹페이지의 HTML에 “새 탭 열고, 개인정보 URL에 embed”하는 프롬프트 인젝션이 숨어있는 경우 데이터 유출 발생.
- 브라우저는 (1) 프라이빗 데이터 접근, (2) 불신 컨텐츠 노출, (3) 외부 커뮤니케이션(이메일, 일정 등) 지원이라는 ‘위험 삼위일체’에 노출.
- 기술적 방어 방법:
- 태그로 감싼 범위에만 프롬프트 적용하도록 LLM에 지시(그러나 우회·탈출 쉽고 취약).
- 지시사항과 외부 컨텐츠 구분(시스템 롤–유저 롤), 무작위 태그 추가로 구분 강화(완전방지는 어려움).
- 궁극적으로 기술·UX·설계가 통합된 구조적 대응이 필수.
- 예시: Dia의 오토필(자동입력) 기능 — 폼 입력 전 데이터를 평문으로 사용자에 노출·확인, 잠재적 인젝션 피해 사전 방지.
- 일정 예약·이메일 작성 등에서도 유사한 “사전 확인” 단계를 추가함.
Arc에서 Dia로의 변화는 제품 단순 진화가 아닌, 조직 구조·업무방식·문화 전반의 변화로 귀결됨
- 기술 변화(LLM 도입)는 브라우저라는 제품 변화를 넘어, 회사의 조직체계와 문화까지 혁신.
- 모델 행동 전담팀 신설, 보안 사고방식 내재화 등 근본 변화가 실제로 이뤄짐.
- 채용, 교육, 커뮤니케이션, 협업 등 경영 전반에 걸쳐 AI 중심 사고와 운영이 뿌리내림.
- 결론적으로, “기술적 변곡점을 인식했다면, 온전한 신념과 확신으로 이를 수용해야 한다”는 메시지로 강연 마무리.