
영상 링크: Stateful Agents — Full Workshop with Charles Packer of Letta and MemGPT
채널명: AI Engineer
상태를 기억하는 에이전트: Letta와 MemGPT 워크숍 전체 핵심 요약
- 영상은 Letta와 MemGPT 프레임워크를 중심으로 한 ‘상태를 기억하는(Stateful) 에이전트’의 개발 워크숍 내용임
- 언어 모델(LLM)을 활용한 기존 에이전트와 달리, 메모리(상태)와 맥락 관리의 중요성을 강조함
- 인간은 경험을 통해 배우고 기억하지만, LLM 기반 에이전트는 본질적으로 상태가 없으므로 별도의 메모리 관리가 필요
- 이 워크숍에서는 오픈소스 Leta 플랫폼을 Docker 및 Jupyter Notebook 환경에서 실습하며, 에이전트 생성과 메모리 관리 기능을 실습
- Leta는 서버-클라이언트 구조로 동작하며, 각 에이전트가 독립적으로 메모리(코어/아카이벌 등)를 관리하고 공유 가능
- 실습을 통해 에이전트가 대화 상대의 정보 변경(예: 이름 변경, 관계 변화 등)을 기억·수정하고, 이를 데이터베이스에 반영하는 과정을 보여줌
- UI 기반 Agent Playground를 제공하여, 프로그래밍 없이 에이전트 생성, 메모리 편집, 툴(도구) 부여, 멀티 에이전트 메시지 전달 등을 쉽게 구현 가능
- 멀티 에이전트 간 상호 메시지 전달 및 비동기 협력, 실제 서비스에 가까운 활용 시나리오 시연
세부 요약 - 주제별 정리
LLM 기반 에이전트는 본질적으로 상태(메모리)가 없어 인간 수준의 학습과 기억을 제공하지 못함
- 현재 LLM(Transformer 기반)은 stateless(비상태)로 설계되어 대화 경험이나 맥락을 지속적으로 보존하지 않음
- 기존 에이전트들은 단순 리스트 추가/버퍼 방식 등으로 상태를 관리하여, 실제 어시스턴트나 협력 에이전트 구현에 한계가 있었음
- 메모리 기능이 없는 에이전트는 사용자 경험과 장기적 활용에 심각한 제약이 발생
효과적인 상태 관리(메모리)가 AGI 및 현실적인 AI 서비스 구현의 핵심임을 강조함
- 인간 수준의 에이전트로 발전하기 위해서는 “상태성(statefulness)” 즉, 메모리가 필수
- 실제 사례(예: 연인과의 이별 정보를 기억 못하는 AI)로 엘엘엠 에이전트 메모리 한계와 그로 인한 치명적 오류를 설명
- 기업용(엔터프라이즈)에서는 사용자별 데이터가 문맥창 크기를 초과할 수 있어, 효과적인 사후 학습(추가 학습 및 맥락 반영)이 필수
Leta와 MemGPT는 에이전트의 장/단기 메모리, 맥락창 최적화, 도구 사용을 통한 자체 메모리 관리 구조를 제공함
- 에이전트의 코어 메모리(최신, 자주 사용하는 정보), 아카이벌/리콜(아카이브) 메모리(장기 저장, 대용량 검색성)로 구성
- 사용자가 아니라 AI가 스스로 메모리 블록을 읽기/쓰기/수정/검색함(도구 호출 방식)
- Pyhton 및 TypeScript 기반 SDK, REST API로 제공되며, 모든 에이전트 상태와 대화 기록이 DB(Postgres 등)에 영구 저장
실습을 통해 에이전트 생성, 메모리 블록 편집, 사용자의 정보 변경 반영, 메시지 전달 등의 실제 동작을 시연함
- Docker, Jupyter notebook 환경에서 Leta 서버 기동 → 에이전트 생성 → 메모리 블록 설정/수정 순서 설명
- 예시로 ‘사용자 이름 변경’을 에이전트가 툴 체이닝(연쇄도구 호출) 방식으로 기억, 실제 데이터 갱신 및 대화 반영
- 아카이브 메모리에는 대용량 문서, 외부데이터 및 장기 선호 정보 등 저장 → 검색/요약 후 대화에 반영
UI 기반의 Agent Playground(저코드 환경)에서 빠르고 직관적으로 상태 기반 에이전트 구축이 가능함
- 프로그래밍 없이 웹사이트에서 에이전트 생성, 메모리 편집, 대화 등 실행 가능
- 시스템 프롬프트, 문맥창 크기(토큰 수), 부여된 도구 등 시각화하여 조정 가능
- 자체 제공되는 트레이싱/시뮬레이터로 실제 입력되는 토큰(문맥) 전체 보기 및 디버깅 가능
비동기 멀티 에이전트 메시지 전달 등 인간 조직과 유사한 확장이 가능함
- 에이전트가 각각 API 기반 독립 서비스로 동작, 서로 간 메시지를 주고받으며 상태/경험을 공유
- 에이전트끼리 동기/비동기 메시지 전달, 태그로 그룹화, 슈퍼바이저-워커 구조 등 다양한 패턴 구현 지원
- 멀티 에이전트 프레임워크(예: autogen) 대비 실제 독립 개체간 상호작용 구현이 쉬움
Leta의 도구(툴) 시스템, 서버 구조, 클라우드/온프레미스 운영, 보안 샌드박스 등 엔터프라이즈에 적합한 아키텍처를 지원함
- 모든 도구는 파이썬으로 자유롭게 구현 가능하며, Composio 등 주요 외부 툴 바로 연동 가능
- 독립형 Docker 컨테이너, Postgres 연동, 외부 API 확장 지원
- 멀티테넌시, 샌드박스 실행 등 실제 SaaS 및 기업 환경에 바로 적용할 수 있는 구조로 설계
- 에이전트 간 상태 동기화, 대용량 메모리 자동 요약, 문맥 한계 내·외부 아카이브 검색 등 고급 기능 제공