
영상 링크: Building Alice’s Brain: an AI Sales Rep that Learns Like a Human - Sherwood & Satwik, 11x
채널명: AI Engineer
앨리스의 두뇌 만들기: 인간처럼 배우는 AI 영업사원을 구축한 비법 핵심 요약
- 11X는 Go To Market(GTM) 조직을 위한 디지털 워커를 개발하는 회사로, AI 영업사원 ‘앨리스(Alice)’와 음성 기반 상담원 ‘줄리안(Julian)’ 등 디지털 인력을 서비스 중임
- 앨리스는 하루 약 5만 건의 이메일을 발송하며, 인간 영업사원(SDR)의 하루 평균 발송량(20~50건) 대비 압도적으로 많은 캠페인을 동시에 진행
- 앨리스가 효과적으로 일하기 위해서는 판매자(셀러)와 판매 대상(리드)에 대한 정보가 필수적이며, 이번 발표는 ‘셀러 정보 학습’을 중점적으로 다룸
- 기존에는 사용자가 수동으로 상품 정보와 자료를 ‘라이브러리’ 형태로 입력해야 했으나, 이 방식은 번거롭고 비효율적이었음
- ‘지식 베이스(knowledge base)’라는 새로운 시스템 도입으로, 앨리스가 셀러의 다양한 자료를 능동적으로 수집·가공하여 이메일 작성에 직접 활용할 수 있게 됨
- 지식 베이스는 문서, 이미지, 웹사이트, 오디오, 비디오 등 모든 자료를 받아 파싱, 청킹, 벡터 저장, 검색, 시각화 과정을 거치며 앨리스의 ‘두뇌’ 역할을 함
- 문서 파싱은 Llama Parse(문서/이미지), Firecrawl(웹사이트), Cloudglue(오디오/비디오) 등 각 전문 벤더의 솔루션을 결합해 최적화
- 파싱된 자료는 마크다운으로 변환 후, 의미 단위를 살려 청크로 나누고 Pinecone 벡터DB에 저장해 유사도 검색 기반 문서 검색을 구현
- 검색(RAG) 단계에서는 최신 ‘딥 리서치 에이전트(Deep Research Agent)’ 기반으로 리드 정보에 따른 질문-계획-검색-응답 흐름이 동작, Leta 클라우드 에이전트 활용
- 시스템의 신뢰성과 사용자 투명성 강화를 위해 3D 기반 벡터 시각화 및 Q&A 기능 제공, 사용자는 앨리스가 ‘무엇을 알고 있는지’ 직접 확인 가능함
- 프로젝트 주요 교훈으로 복잡성(RAG 도입의 어려움), 프로덕션 우선주의(먼저 운영 후 최적화), 벤더 활용의 중요성을 강조하며, 향후 고도화 및 비용 절감을 목표로 함
세부 요약 - 주제별 정리
11X의 디지털 워커 전략과 앨리스의 역할 확대가 GTM 조직 혁신을 이끌고 있음
- 11X는 GTM(Go To Market) 조직에 특화된 디지털 작업자(Digital Worker)를 개발
- 현재 대표 디지털 워커로 이메일 기반 AI 영업사원 앨리스(Alice)와 음성 상담원 줄리안(Julian)을 운영 중
- 앨리스는 SDR(Sales Development Representative, 영업개발 담당자) 역할을 자동화하며, 기업의 리드 소싱·컨택·미팅 예약까지 전체 영업 파이프라인을 돕고 있음
- 하루 약 5만 건의 이메일 발송 및 300여 개 조직의 캠페인 병행 지원 등, 물리적 한계 없는 대규모 다중 캠페인 성과 달성
- 셀러(판매자)와 리드(고객후보), 두 대상의 맥락 정보를 적시에 알아야 성과가 나오는 구조임
기존 라이브러리 방식의 한계는 사용자 피로와 메일 품질 저하로 이어졌음
- 초기 버전의 앨리스는 사용자가 직접 상품·서비스·케이스스터디 등 자료 정보를 ‘라이브러리’에 입력해야 했음
- 상품 설명, 세부 특장점, 고충 해결 사례 등 매우 상세한 데이터를 수작업으로 입력 필요
- 이 방식은 온보딩에 큰 장벽을 초래하고, 자료 입력을 마치기 전까지 캠페인 운용이 불가
- 사용자가 너무 많은 자료를 입력하면 앨리스가 이메일 작성 시 관련성을 떨어뜨리고, 너무 적게 입력하면 리드에 맞는 제안을 찾지 못하는 문제가 있었음
셀러 주도 ‘푸쉬’에서 앨리스 주도 ‘풀’로 전환해 지식학습 혁신을 이룸
- 기존에는 셀러가 능동적으로 ‘아웃풋(문맥)을 푸쉬’했다면, 혁신 이후에는 ‘앨리스가 능동적으로 문맥을 풀’하는 구조로 재설계
- ‘지식 베이스(Knowledge Base)’라는 중앙 저장소를 도입하여 셀러 자료(문서, 이미지, 영상 등)를 대량 업로드 후, 자동으로 파싱·저장·가공 처리
- 앨리스는 각 리드 및 상황에 따라 가장 적합한 정보 조합을 활용, 더욱 맞춤화된 이메일 메시지를 생성
SDR(영업개발 담당자)이 학습하는 다양한 자료 유형을 구조화하여 수집 자동화를 실현함
- 실제 SDR이 마케팅 자료, 케이스스터디, 영업 녹취, 보도자료 등 다양한 형태의 정보를 참고하는 과정을 앨리스에 반영
- 이를 파일 유형별(문서·이미지·웹사이트·오디오·비디오)로 카테고리화, 데이터 파싱 및 저장 체계를 표준화
- 사용자(셀러)는 다양한 소재 자료를 드래그앤드롭 등 방식으로 한 번에 업로드 가능
문서, 이미지, 웹 데이터 등 파싱은 전문 3rd-party 벤더와의 협업으로 해결함
- 5가지 주요 리소스: 문서(Documents), 이미지(Images), 웹사이트(Websites), 오디오(Audio), 비디오(Video)
- 각 리소스별로 최적의 파싱 툴 선정
- Llama Parse(문서/이미지): 가장 다양한 파일 포맷 지원, Slack을 통한 빠른 고객 지원
- Firecrawl(웹사이트): 크롤링 성능 및 프로젝트 적합성에서 우위
- Cloudglue(음성/영상): 오디오·비디오 동시 지원, 단순 대본 추출이 아니라 비디오 내 정보까지 추출
- 파싱 출력은 구조정보와 의미가 유지되는 마크다운(Markdown) 포맷을 표준으로 삼음
파싱 결과를 효과적으로 쪼개고 저장하는 청킹 전략도 실제 활용에 최적화되어 있다
- 긴 마크다운 결과물을 의미 단위별로 ‘청크(chunk)’로 자동 분할
- 마크다운 헤더, 문장, 토큰 기준 등 방식을 복합 적용(워터폴 전략)
- 각 청크는 벡터DB 저장 및 검색 효율, UI 시각화 결과물 품질에도 직결됨
- 다양한 리소스 유형(PDF, 파워포인트, 동영상 등)에 각기 맞는 청킹 방식을 조합 적용
- 너무 긴 청크는 내용 희석, 너무 작은 청크는 의미 단편화 문제에 중점을 두고 청킹
벡터 데이터베이스 기반 정보 저장·검색 인프라는 Pinecone 도입으로 운영 효율을 극대화함
- 벡터DB 사용은 유사도(Similarity) 기반 정보 검색이 주 목적이며, 대표적으로 Pinecone을 선정
- Pinecone의 선택 이유:
- 클라우드 기반, 쉬운 시작, 내장 임베딩 모델 제공, 우수한 지원·문서화
- 외부 임베딩 모델을 별도 구비할 필요 없음
- 고객 데이터 기반 다양한 DB 옵션(그래프DB 등)과 비교·분석 지원 적극적
검색(RAG) 단계는 최신 딥 리서치 에이전트(Deep Research Agent) 구조로 고도화됨
- 전통적 RAG에서 발전해, 최근에는 ‘계획(Plan)-다중 검색-응답’ 반복이 가능한 전략적 에이전트 형태로 진화
- Leta(클라우드 에이전트 플랫폼) 기반, 리드 정보와 질의가 들어오면 단계별로 정보검색, 응답, 요약의 플로우를 수행
- 복잡한 질의 혹은 캐스케이딩(여러 단계로 분할된) 검색에도 유연하게 대응
- 에이전트는 캠페인 생성시 단계별 Q&A 형식 인터페이스와 연결, 실제 메시징 플로우에도 검색 청크를 실질 활용
리드 및 셀러가 직접 앨리스의 ‘두뇌’를 마주할 수 있도록 3D 시각화 및 Q&A UI를 제공함
- 고객(셀러)은 앨리스가 본인의 비즈니스를 ‘정확히’ 이해하는지 항상 우려
- 신뢰 확보 및 교육 목적에서 Pinecone 벡터 데이터(청크)를 3차원 공간에 ‘노드’로 시각화하여, 각 노드 클릭시 그 내용과 출처 직접 확인 가능
- Q&A 인터페이스에서 데이터 기반 답변 청크들이 드롭다운 형태로 표시되어, 어떤 자료에서 답변이 나왔는지 투명하게 검증 가능
- ‘교육하기(learn)’ 버튼 하나로 전체 학습부터, 캠페인 생성/실행 흐름까지 완전 자동화
앨리스의 학습 및 정보 활용 방식이 ‘인간 SDR 온보딩’ 경험에 근접하게 설계됨
- 인간 영업사원도 입사 후 각종 자료를 받아 여러 주에 걸쳐 점진적으로 사업 이해도를 높이듯, 앨리스 역시 자료 대량 투입만으로 신속한 온보딩 구현
- 반복 질문, 다양한 상황에의 대응, 케이스스터디 활용 등 복잡한 실전 업무 흐름도 수준 높은 자동화
프로젝트 개발 과정에서 얻은 ‘복잡성, 프로덕션 우선주의, 벤더 극대화’ 교훈 공유
- RAG 시스템 구현은 생각 이상으로 복잡하며, 중간의 수많은 미세 의사결정과 다양한 기술·벤더 평가를 요구함
- 운영에 우선 집중(프로덕션 우선주의), 초기에는 정확도·비용보다 일단 실사용에 투입해서 데이터와 기능성을 확보하는 것이 중요
- 최적의 벤더·API 활용 및 벤더에게 적극적인 지원·교육 요청이 프로젝트 성공의 핵심적인 동인으로 작용함
앞으로 앨리스의 향상은 환각 현상 최소화, 정확도·포괄성 평가, 하이브리드 RAG 실험, 비용 절감에 집중할 계획임
- 이메일 생성시 환각(hallucination) 문제 추적 및 개선
- 파싱 벤더 평가 기준 ‘정확도(accuracy)·포괄성(completeness)’을 데이터 기반으로 재정립
- 그래프DB와 벡터DB를 결합한 ‘하이브리드 RAG’ 구조 실험 예정
- 전체 데이터 파이프라인의 비용 절감 방안 탐색
- 현재 추가 인재 영입도 진행 중임(채용 안내)