From Arc to Dia: Lessons learned building AI Browsers - Samir Mody, The Browser Company of New York

영상 링크: From Arc to Dia: Lessons learned building AI Browsers – Samir Mody, The Browser Company of New York
채널명: AI Engineer

Arc에서 Dia까지: AI 브라우저 구축 과정에서 얻은 교훈 핵심 요약

브라우저 컴퍼니 오브 뉴욕(BCNY)은 2019년에 설립되어, 기존 브라우저의 한계를 넘어 현대 인터넷 사용 방식에 맞는 브라우저 개발을 목표로 시작됨.
첫 제품 Arc(2022)는 기존 브라우저 대비 개인화·조직화·사용자 경험 향상을 제공했으나, 궁극적인 비전을 달성하지 못했다고 평가.
2022년 대형 언어 모델(LLM: GPT 등) 접근성이 커지며, AI 기능 프로토타이핑 및 통합을 시작함.
2024년 ‘Act 2’ 동영상을 통해 “AI가 인터넷 사용 방식과 브라우저 자체를 근본적으로 바꿀 것”이라는 회사의 논지를 공개.
Arc의 경험을 바탕으로, AI 본연의 속도와 보안을 염두에 두고 제로베이스에서 Dia 브라우저(2024)를 개발 및 출시함.
Dia는 사용자의 업무 맥락을 이해하고, 탭과 앱 활용을 돕는 맞춤형 AI 어시스턴트 기능을 제공.
빠른 반복개발 및 혁신을 위해 프로토타입 툴, eval 시스템, 데이터 수집, 자동화 등 내부 도구 체계화에 투자.
Jepa 같은 자동 프롬프트 최적화 기법을 활용하여 LLM 프로덕션 품질과 기능을 지속적으로 고도화.
모델 행동 설계 전담팀을 신설하여, AI 어시스턴트의 성격·스타일·행동을 정교하게 설계하고 조직 내 누구나 직접 프롬프트를 개선할 수 있는 환경을 마련함.
AI 브라우저의 핵심 보안 위협인 프롬프트 인젝션 대응을 위해 기술적·디자인적·UX적 조치가 모두 통합된 구조를 지향.

세부 요약 - 주제별 정리

브라우저 컴퍼니의 설립 배경과 Arc의 출시가 기존 브라우저 시장에 던진 의미

브라우저 컴퍼니(BCNY)는 2019년 설립, “인터넷 사용 패러다임에 맞는 브라우저로의 재창조”를 신념으로 삼음.
당시 브라우저 소프트웨어는 수십 년간 사용 방식이 변해도 자체 변화가 거의 없어 혁신 필요성이 대두됨.
2022년 Arc 브라우저를 최초 출시, 더 나은 개인화, 정돈된 UI/UX, 장인정신 강조 등 차별화된 경험을 제공.
Arc는 ‘더 나은 브라우저’라 평가받으며 수많은 팬을 확보, 지금도 수백만 명이 사용.
그러나 Arc는 시장 내 기존 브라우저 대비 “점진적 향상(Incremental improvement)”에 불과했음을 시인, 궁극적 비전과 괴리 존재.

LLM 도입이 BCNY의 제품 방향성과 비전을 재설정하게 만든 계기

2022년, GPT 등 LLM 등장과 API 개방으로 AI 기능 탐색 및 프로토타이핑을 즉각 개시함.
Arc에 일부 AI 기능을 시범 도입하며, 단순 기능 확장을 넘어 AI 자체가 브라우저 구조와 사용방식에 혁신을 일으킬 것임을 인식.
2024년 초 ‘Act 2’ 유튜브 영상에서 “AI가 브라우저와 인터넷 사용법을 구조적으로 변화시킬 것”이라는 기업의 공식 비전 공개.
이 계기를 바탕으로, AI 최적화 설계를 기반으로 한 새로운 브라우저(Dia) 개발을 착수함.

AI 본연의 속도와 보안을 목표로, 제로베이스에서 새롭게 Dia 브라우저를 구축함

기존 Arc의 틀을 탈피, AI의 속도와 보안을 근간으로 Diaz를 ‘처음부터’(from the ground up) 설계.
2024년, AI 네이티브 설계의 Dia 브라우저를 론칭, 기존 제품과 아예 다른 구조 및 사용성을 지향.
모든 탭, 앱, 플로우에서 사용자를 ‘이해’하고 맥락 중심의 맞춤형 AI 어시스턴트가 실시간 업무 지원.
사용자의 과거 기록, 개인화된 워크플로우, 탭 및 앱 활용 도우미 등 다양한 AI 기반 기능 통합.
아직 회사의 궁극적 비전엔 미치지 못하지만, 목표 달성을 위한 중요한 진척임을 강조.

빠른 아이디어 실험과 반복개발을 위해 모든 도구와 프로세스를 사내용 소프트웨어로 내재화함

“더 빨리 빌드하고, 더 빨리 출시하고, 더 빨리 학습하는” 속도를 핵심 경쟁력으로 삼음.
초기에는 엔지니어만 접근 가능한 ‘프롬프트 에디터’가 존재, 팀 내 한계와 느린 반복을 경험.
이후 사내 전 직원이 사용할 수 있는 프로덕트 내 툴(프롬프트, 모델, 컨텍스트·파라미터 관리 등)로 확장.
CEO에서 신입까지 아이디어 제안, 실험, 개선 과정에 즉시 참여 가능.
메모리 지식 그래프, 컴퓨터 유즈 메커니즘 등 각종 프로토콜 최적화 도구를 모두 직접 도입 및 운영.
다양한 직군(PM, 디자이너, CS, 전략·운영 팀 등)이 각자 실제로 아이디어를 프로토타입, 실험할 수 있는 환경 조성.

Jepa 등 프롬프트 최적화 자동화 시스템 도입으로, LLM 기반 기능을 효율적으로 고도화함

LLM 기능 개선, 특히 프롬프트 최적화를 위한 자동화 기법(Jepa 등)에 투자.
Jepa는 RL(fine-tuning 등) 없이 ‘샘플 효율적으로’ 프롬프트를 개선하는 방법론임.
- 사용법: 초기 프롬프트 집합을 준비, 각종 과제에 적용·스코어링(평가) 실시.
- PA(Preference Aggregation) selection으로 최적 프롬프트 선정.
- LLM을 활용하여 피드백(반성) 및 새로운 프롬프트 자동생성 → 반복.
- 반사적(Reflective) 프롬프트 변이 기법, 선택(Selection) 확장 등의 혁신점.
- 텍스트(프롬프트)만 튜닝, 모델 파라미터(weight) 변경 불필요.
실제 Arc 및 Dia에서 단순 프로토타입 프롬프트도 Jepa로 품질 및 성능 고도화.

프로토타이핑·평가·자동화 등 빠른 기능 실험과 출시를 위한 단계별 개발 프로세스를 운용함

아이디어·프로토타이핑 단계: 누구나 쉽게 아이디어를 생성, 매주/매일 실험(‘at-bats’의 최대화).
사내 도그푸딩, 실제 유용성 및 품질 임계치 도달 가능성 평가.
진짜로 문제 해결 가능성(utility) + 고품질 목표 충족이 판단될 때 다음 단계 진입.
이후 평가 지표 수집·정교화, 코드·프롬프트·자동화(Jepa 등) 기반 반복적 개선.
내부 테스트 및 데이터 피드백 → 실제 제품 출시.
반복 가능·효율적인 선순환 구조 구축이 목표.

모델 행동 설계를 하나의 전문 공정으로 분리하여, 제품 품질을 체계적으로 높임

모델 행동(Model behavior)이란: 제품 내 AI가 보이는 행동·성격·스타일을 평가·정의·배포하는 과정.
- 원칙을 제품 요건(프롬프트, 평가, 사양 등)으로 구체화.
- 어시스턴트의 응답 스타일·톤·기능 단계별로 명확히 정의.
- 행동 설계(Behavior design), 데이터 수집·평가, 모델 스티어링(프롬프트/모델/컨텍스트 관리) 등 하위작업으로 분류.
반복적 방식: 개발→정제→새 평가→피드백 수집(내부·외부)→반영의 순환.
기존에는 단순 지시어/프롬프트 중심이었으나, 이제는 에이전트 행동 설계(목표지향적 추론, 자율적 작업, 자기교정·학습, 성격화 등)로 진화 중.
BCNY는 “모델 행동”이 제품개발 내 핵심 기능화될 것이며, 점점 더 전문성과 중요성을 갖게 됨을 강조.

모든 팀원이 모델 행동을 설계할 수 있는 환경으로 전환하고 역할 경계를 허물어 혁신을 이룸

팀 내 엔지니어가 직접 프롬프트 작성하던 체계에서 내부 도구 확대 후 다양한 직군이 참여.
예시: 전략·운영팀의 구성원이 주말 동안 기존 모든 프롬프트 재작성, 월요일 동영상으로 결과 공유 후 제품 품질 및 경험 비약적 개선.
이러한 성공적 경험을 계기로 모델 행동 전담팀 신설.
“누가 모델 행동을 설계할 적임자인가?”에 대해, 고정된 역할 관념 대신 칸막이 없는 협업·참여 방식을 지향함.

프롬프트 인젝션 등 AI 브라우저 보안 위협에 대해 기술과 UX를 아우른 복합적 대응 전략을 적용함

프롬프트 인젝션: 외부 컨텐츠(예: 웹 페이지)에 숨겨진 프롬프트가 LLM 명령을 오버라이드, 데이터 유출·악성 명령 실행·안전 규칙 무시 등의 피해를 유발.
- 예시: 요약 요청된 웹페이지의 HTML에 “새 탭 열고, 개인정보 URL에 embed”하는 프롬프트 인젝션이 숨어있는 경우 데이터 유출 발생.
브라우저는 (1) 프라이빗 데이터 접근, (2) 불신 컨텐츠 노출, (3) 외부 커뮤니케이션(이메일, 일정 등) 지원이라는 ‘위험 삼위일체’에 노출.
기술적 방어 방법:
- 태그로 감싼 범위에만 프롬프트 적용하도록 LLM에 지시(그러나 우회·탈출 쉽고 취약).
- 지시사항과 외부 컨텐츠 구분(시스템 롤–유저 롤), 무작위 태그 추가로 구분 강화(완전방지는 어려움).
궁극적으로 기술·UX·설계가 통합된 구조적 대응이 필수.
- 예시: Dia의 오토필(자동입력) 기능 — 폼 입력 전 데이터를 평문으로 사용자에 노출·확인, 잠재적 인젝션 피해 사전 방지.
- 일정 예약·이메일 작성 등에서도 유사한 “사전 확인” 단계를 추가함.

Arc에서 Dia로의 변화는 제품 단순 진화가 아닌, 조직 구조·업무방식·문화 전반의 변화로 귀결됨

기술 변화(LLM 도입)는 브라우저라는 제품 변화를 넘어, 회사의 조직체계와 문화까지 혁신.
모델 행동 전담팀 신설, 보안 사고방식 내재화 등 근본 변화가 실제로 이뤄짐.
채용, 교육, 커뮤니케이션, 협업 등 경영 전반에 걸쳐 AI 중심 사고와 운영이 뿌리내림.
결론적으로, “기술적 변곡점을 인식했다면, 온전한 신념과 확신으로 이를 수용해야 한다”는 메시지로 강연 마무리.