
영상 링크: Building an Agentic Platform — Ben Kus, CTO Box
채널명: AI Engineer
에이전틱 플랫폼 구축 – Box CTO 벤 쿠스 핵심 요약
- Box는 15년 이상 역사와 115,000여 개 엔터프라이즈 고객을 보유한 비정형 콘텐츠 관리 플랫폼임
- Fortune 500 기업 중 2/3가 Box를 사용하며, AI 도입의 첫 단계로 Box를 채택한 사례도 많음
- Box는 데이터 보안 및 안전한 AI 활용을 최우선으로 하는 엔터프라이즈 환경을 지원
- 인공지능 도입 초기에는 단순 문서 QA와 데이터 추출, AI 기반 워크플로우 등의 생성형 AI 기능을 도입
- 대부분 기업 데이터의 90%가 비정형 데이터로, 기존에는 이를 구조화하기 위해 복잡하고 비용이 큰 IDP(문서 처리) 솔루션, ML 모델, 커스텀 벤더, 대규모 학습 데이터 등이 필요했음
- 생성형 AI(DALLE, GPT 등) 기반 범용 모델 활용 시, 기존 특화 ML 모델보다 유연하고 정확한 데이터 추출 성능을 경험
- 그러나 문서가 복잡해질수록, 대용량․다수 필드, 다양한 언어 및 포맷, OCR 한계 등으로 AI의 정확성, 확장성, 신뢰도에 심각한 문제 발생
- 고도화된 문제 해결을 위해 ‘에이전틱(Agentic) 방식’으로 전환, 계획·추론·복수 모델 활용·체크 등 단계별 지능형 워크플로우를 구현
- 에이전틱 아키텍처 도입 후 문제 발생 시 전체 시스템 재설계 대신 작은 단계별 개선으로 빠른 진화와 확장성 달성
- Box는 Agent API를 제공하며, 엔터프라이즈 고객들이 다양한 에이전트 기능을 직접 활용할 수 있도록 지원
- 모델 파인튜닝보다 프롬프트 엔지니어링 및 다중 모델 조합, 에이전틱 워크플로우가 유지/확장성 측면에서 더 효율적이라 판단
- 평가는 LM as a judge(모델 판단), 자체 챌린지 평가셋, 고객 피드백 혼합 방식으로 진행하며, 지속적으로 복잡 케이스까지 대비
세부 요약 - 주제별 정리
Box는 대규모 엔터프라이즈 비정형 데이터 관리 전문 플랫폼임을 강조함
- Box는 15년 넘게 비정형 콘텐츠 플랫폼을 운영해 왔음
- 115,000여 개 엔터프라이즈 고객과 Fortune 500 중 약 2/3가 Box를 활용
- 1 엑사바이트 이상의 데이터, 수백억 건의 파일을 관리하며 최고의 데이터 보안과 안전성 제공
- 고객 대부분이 AI 도입에 신중하며, Box를 AI의 첫 배포 지점으로 신뢰
- 목표는 고객이 콘텐츠로 할 수 있는 모든 작업(검색, 관리, 워크플로우 등) 기능 제공
과거의 비정형 데이터 자동화는 특화 ML모델·IDP 중심의 복잡하고 높은 진입장벽의 영역이었음
- 비정형 데이터(문서, 계약, 프로젝트 제안서 등)는 전체 데이터의 약 90% 차지
- 기업들은 오랜 기간 비정형 데이터 자동화를 희망했으나 현실적 어려움 큼
- 기존에는 IDP(지능형 문서 처리)라는 수십억 달러 규모 산업이 존재했으며, 이들은 특화 ML 모델 구축, 대규모 학습 데이터, 커스텀 벤더 연동을 필요로 함
- 이러한 방식은 특정 문서유형에만 맞추기 쉽고, 확장성과 범용성, 유지보수에 큰 문제 발생
- 과거에는 비정형 데이터를 억지로 구조화하려 하거나 자동화 자체를 포기하는 분위기였다
생성형 AI의 도입으로 범용 데이터 추출 품질이 크게 향상되는 변화를 경험함
- 2023년 생성형 AI(GPT-2, GPT-3 등)가 실전에서 효과적임을 확인
- OCR 등 기본 전처리 후 프롬프트 기반 단발성(single shot) AI 호출만으로 바로 뛰어난 추출 성능을 달성
- 상용 범용 AI 모델(OpenAI, Anthropic 등)로도 과거 최고의 특화 모델보다 더 유연하고 정확함
- 범용성(문서 유형, 필드 등), 성능, 구현 용이성, 여러 모델 동시 지원 등 기술적으로 큰 진전 경험
- 고객들에게 다양한 문서 추출 적용 시 성공적인 결과를 보여줌
문서 복잡성·언어·OCR 한계 등으로 생성형 AI의 한계가 빠르게 드러남
- 문서가 복잡해지거나(예: 300페이지 임대차 계약, 수백 필드), 여러 언어/파일포맷 혼재, 고난이도 OCR 문제 등에서 AI의 응답 품질이 심각하게 저하됨
- AI가 동시에 너무 많은 필드, 복잡 지시를 전달하면 맥락 추적 및 일관성에서 오류 발생
- 기존 ML과 달리 LLM은 자체 신뢰도/정확도(Confidence Score) 인지 기능이 부족
- LM as a judge(추출 결과 자체 평가), 다중 모델 결과 비교, 후처리 등을 적용해도 반복적인 한계 발생
고도화된 엔터프라이즈 요구(정확도, 신뢰성, 처리 복잡성 등)가 AI 도입에 적극적 제약 요인이 됨
- 영문·다국어 지원, 다양한 포맷, 복잡 필드 매핑 등 고객 사용 상황이 매우 다양
- 단순 추출이 아닌 리스크 평가 등 추가적 복합 작업 요구
- “AI가 정말 이런 복잡한 문제를 해결할 수 있나”에 대한 회의감과 도전적 과제가 발생
- 다음 세대 AI 모델이나 더 나은 벤더 출시까지 대기하는 ‘정체 상태’가 일시적으로 발생함
Box는 근본적인 한계를 극복하기 위해 에이전틱(Agentic) 접근법으로 전환함
- 전통적으로 OCR·ML 개선, 포스트 프로세싱, 정규식 기반 등 단순 ‘업그레이드’ 중심 논의가 많았으나 지속적인 한계 인식
- 에이전틱 아키텍처는 ‘지능형 에이전트’가 다수의 단계적 작업(지침 생성, 메모리, 툴 호출, 다중 AI모델 적용 등)을 조율함
- Directed Graph(유향 그래프) 기반의 워크플로우 구조 설계, 계획 기반/자동화/문제별 유연 조정 등으로 복잡도를 관리
- 예: 필드별 그룹핑, 필드 간 맥락 보존을 위한 세분화, 여러 번의 쿼리·체크, 다중 AI모델 투표·교차 검증 적용
- AI가 문제를 풀지 못하면 추가 피드백→재시도 과정을 통해 점진적 정확도 향상
- 이러한 접근법은 시스템 전체 재설계 없이도 세밀한 부분 수정만으로 빠르고 유연하게 진화 가능
에이전틱 아키텍처 도입 후, 다양한 케이스와 사용자의 복잡한 요구도 빠르게 대처함
- Deep Research 등 고난도 기능에도 쉽게 확장 적용 가능
- OpenAI/Gemini가 인터넷에 깊은 리서치를 하듯, Box 사용자가 자신의 데이터셋에서 심층 질의와 연구가 가능
- 에이전트 워크플로우 각 단계에서 검색, 관련성 판단, 아웃라인 생성, 계획 수립, 요약 등 단계별 세부 분할 처리 구현
- 신규 또는 복잡 케이스 발생 시 전체 설계 변경 없이 구성요소 추가(노드 추가, 체킹 단계 추가 등)만으로 유연 대응 가능
에이전틱·AI 중심 설계 사고방식 전환이 팀과 제품 진화에 중요함을 실감함
- 에이전틱 레이어를 아키텍처적 기본 계층으로 삼으면, 작업 단위 분리·진화에 유리함
- 분산시스템 설계와 독립적으로, 다중 워크플로우와 고속 대량 처리 모두 유연하게 병행 가능
- 팀 내에서 ‘에이전틱-퍼스트’ 사고와 개발 문화가 정착되어야 진정한 생산성 및 진화 달성
- Box 엔터프라이즈 API(Agent API) 제공 등 고객도 직접 에이전트 워크플로우를 활용·확장 가능하게 적극 지원
- 멀티 모델 지원(예: OpenAI, Gemini, Llama, Anthropic)과 그에 맞는 프롬프트 기반 조합을 중시
파인튜닝 모델 대신 프롬프트/에이전틱 설계를 선호하는 이유를 설명함
- 파인튜닝 기반 접근은 모델별·세대별로 매번 파인튜닝이 필요, 여러 벤더 모델을 동시에 파인튜닝하기 어렵고 유지·확장에 불리
- 최신 생성형 AI는 차기 버전에서 자연스레 품질이 향상되어 파인튜닝의 유지비용과 효익이 불일치
- Box는 프롬프트 엔지니어링과 에이전트 아키텍처 중심으로 복잡한 요구를 효과적으로 대응
- 실제 워크플로우에서는 다양한 프롬프트 조합과 캐싱, 다중 모델 사용 전략을 적극 채택
평가·검증 방식도 다층적 시스템으로 운영하여 신뢰성 확보
- 평가 방식: LM as a judge(LLM 기반 결과 평가), 자체 평가세트(Eval Set), 챌린지/고난도 평가세트 병행
- 점점 복잡해지는 사용 케이스에 대비해 새로운 평가 데이터를 지속 생성 및 활용
- 엔터프라이즈 특성상 실제 사용 중인 데이터 피드백은 제한적이지만, 가능한 한 사용자 피드백을 적극 반영
API 퍼스트 정책과 아키텍처적 교훈을 최종적으로 강조함
- Box는 모든 주요 에이전트 기능들을 API로 제공, 확장성과 연동성 강조
- 에이전틱 아키텍처를 초기부터 도입하면, 다양한 문제와 지속적 진화에 훨씬 강력하게 대응할 수 있음
- AI가 적용 가능한 영역에서는 최대한 일찍 에이전틱 설계를 채택할 것을 강력히 권장