Skip to content
Go back

How to build world-class AI products - Sarah Sachs (AI lead @ Notion) & Carlos Esteban (Braintrust)

Published:  at  05:19 PM
YouTube Thumbnail

영상 링크: How to build world-class AI products — Sarah Sachs (AI lead @ Notion) & Carlos Esteban (Braintrust)
채널명: AI Engineer

세계적 수준의 AI 제품을 만드는 법 — Notion AI 리드 Sarah Sachs와 Braintrust 강연 핵심 요약


세부 요약 - 주제별 정리

Notion AI는 신속한 모델 적용과 대규모 사용자 지원을 위해 평가 자동화 시스템을 정립함

AI 제품 품질의 핵심은 관측성과 체계적 평가에 있고, 작업시간의 90%를 여기에 투자함

Notion AI의 발전 과정은 ‘단순 인라인 생성’에서 ‘멀티에이전트·서치’까지 단계적으로 이뤄짐

데이터셋 구축, 평가 기준, 스코어링 함수 개발은 데이터 스페셜리스트가 주도하며 품질 우선 원칙을 고수함

LLM을 평가자로 삼는 “LLM as a Judge” 체계를 다층적으로 활용하여 예측 불가능한 문제까지 철저히 통제함

실사용자 피드백, 특히 thumbs down은 신속한 개선, 신규 데이터셋 생성, 제품 방향성에 강한 영향을 미침

워크플로 상 “오프라인 평가”와 “온라인 평가”의 경계와 반복적 개선 사례를 상세히 시연함

Braintrust 플랫폼은 Playground(빠른 실험), Experiments(누적 관리), SDK·코드 연동을 통해 공동작업·자동화·배포를 완성함

실제 실습과정을 통해 프로젝트 생성, 데이터셋·프롬프트·스코어 관리, 평가 자동화 루프를 구현함

멀티턴 대화, 에이전트, 멀티모달, 도구 버전 관리 등 실제 복잡한 워크플로와 엔터프라이즈 요구까지 상세히 연동함

Human-in-the-loop: 데이터셋 품질 향상, 실제 서비스 신뢰성 강화에 전문가 평가·유저 피드백을 적극 편입

Remote Eval 등 고차원적 활용법으로 ‘복잡한 엔지니어팀–비기술팀’ 협업 및 R&D 생산성 향상



수정 요청하기

Previous Post
From Mixture of Experts to Mixture of Agents with Super Fast Inference - Daniel Kim & Daria Soboleva
Next Post
Data is Your Differentiator: Building Secure and Tailored AI Systems - Mani Khanuja, AWS