영상 링크: Building Intelligent Research Agents with Manus - Ivan Leo, Manus AI (now Meta Superintelligence)
채널명: AI Engineer
Manus를 활용한 지능형 리서치 에이전트 구축 핵심 요약
- 이 워크숍은 Manus(메타 슈퍼인텔리전스) API를 활용해 리서치 및 자동화 에이전트를 구축하는 실전 데모와 크게 5단계의 코드 노트북을 통해 API, Slack, 웹, 파일 관리 등 주요 기능을 학습하는 순서로 진행됨.
- Manus는 단순 질의응답을 넘어서 실제 ‘업무 실행’ 및 워크플로 자동화까지 수행하는 범용 AI 에이전트로 설계되었으며, Slack, 메일, 웹, API, 브라우저, MS 365 등 다양한 환경에서 동작 가능함.
- 최근 Manus 1.5 및 1.5 Lite 출시로 속도와 품질이 크게 향상됐고, 모델 구조도 재설계됨.
- 데모에서는 언어 학습(프랑스어 교정/학습), 메일 자동화, 브라우저 기반 자동 업무, 이벤트 정보 자동 스크래핑 및 웹사이트 생성 등 실제적 활용 사례들을 상세히 선보였음.
- 초기 API 활용을 위해 .env 구성, API키 세팅, 파일 업로드 및 삭제, 슬랙 토큰 관리부터 시작하여, 비동기 태스크 처리 및 세션 맥락 관리 패턴까지 단계별로 보여줌.
- API를 통해 PDF, 이미지, URL 등 다양한 데이터 소스 연동/분석, 자동화된 워크플로, 웹훅(webhook) 기반 대규모 태스크 처리 방식을 제공함.
- Slack 연동 실습에서는 슬랙봇 구현 기본부터, 파일 첨부 처리, 멀티턴 대화, 스레드-태스크 매핑, 웹훅을 통한 응답 처리, 멀티 유저 대응까지 실제 코드를 중심으로 다룸.
- 현장 Q&A를 통해 보안/프라이버시(미국 내 저장, 직접열람 불가), API 활용사례(리서치, 정부사이트 자동화 등), 웹개발 자동화, 브라우저 접근 등 확장 이슈까지 명확히 짚었음.
- 데모에서 슬랙, 노션, 크로마 등 여러 외부 플랫폼과 실시간 통합 사례 공개 및 향후 PPT/마크다운 등 포맷 연동 확장 계획 언급.
- 실시간 웹앱과 API의 기능 차이/연동성, 메모리/세션 관리에 대한 한계와 향후 로드맵, 개발 실수 및 문제 해결 방법까지 구체적으로 전달함.
세부 요약 - 주제별 정리
Manus는 다양한 채널에서 복합적 자동화 작업을 직접 실행하는 범용 AI 에이전트를 지향함
- Manus는 단순한 챗봇을 넘어서 실제 태스크 실행, 워크플로 자동화, 다양한 외부 시스템 통합을 목표로 함.
- Slack, 메일, 웹, iOS 앱, 맞춤형 API 등 다양한 접점(Entry point)에서 바로 활용 가능하도록 설계됨.
- 최근에는 Microsoft 365(Word, PowerPoint, Excel 등) 및 자체 브라우저 연동 기능도 추가되어 사용자의 실제 업무 환경에서 바로 동작 가능해짐.
- 하나의 모델로 메일 회신, 워크플로 자동화, 문서 생성, 브라우저 조작 등 모든 범용적 작업을 처리하도록 구조화함.
- 팩트: Manus 1.5/1.5 Lite는 사용자가 상황에 따라 속도와 품질을 선택 가능(1.5 - 고품질, 1.5 Lite - 속도 위주).
다양한 실제 데모 사례를 통해 AI 기반 자동화 활용법을 보여줌
- 프랑스어 문장 교정/학습 앱: 사용자 입력에 대하여 Language Model이 인라인 수정, 전체 교정문, 단어 해설 등을 제공.
- Manus는 자동으로 사용자의 프로필(나이, 소속, 강점/약점 등)을 추론해 맞춤형 언어 학습 조언을 개인화함.
- MailManus: 모바일에서 메일 기반 워크플로(예: 회신, 트래킹 등)를 자동화하는 데 사용 가능함.
- 브라우저 오퍼레이터: 단일 명령으로 실제 사용자의 인증된 브라우저를 원격제어, 커피숍 검색, 지도 확인 등 실제 액션을 수행.
- 대규모 행사 일정 스크래핑 사례: 특정 웹사이트에서 이벤트 정보 크롤링, Google Calendar 연동, 비슷한 행사 추천, 타임라인 자동 생성 기능을 API와 연계하여 구현.
- 대시보드 사례: Rick and Morty API 데이터셋을 사용해 등장인물 정보 시각화 사이트 자동 생성.
API 연동과 초기 사용법을 .env 구성, 키 관리부터 단계별 설명함
- API Key 발급 및 .env 변수 세팅: API key, Slack Bot Token, Slack Signing Secret가 필요.
- 제공 노트북 5종(tinyurl.com/manus-api-workshop)을 통해 점진적으로 예시 코드 진행.
- API 최초 연결 테스트는 파일 목록 조회(빈 리스트 반환) 확인으로 체크하며, 파일 업로드시 48시간 후 자동삭제(수동도 가능) 등 프라이버시 중시.
- 응답 가격정책은 웹앱과 API 동일(투명한 비용체계).
태스크 생성 및 결과 폴링 - 비동기식 자동화 워크플로 구현법
- ‘태스크’ 단위로 API를 호출(예: “2+2는 무엇인가?” 질의), 각 태스크는 ID, 제목, URL을 반환.
- 태스크 상태: running(실행중), pending(추가입력 대기), completed(완료), error(에러) 4단계.
- 폴링 방식(주기적 상태 확인)으로 태스크 완성 및 진행 상태 추적.
- 동일 세션/문맥 유지: 동일 태스크 ID로 후속질의/명령 전송 가능 → 멀티턴 대화, 장기 문맥 관리 실현.
파일/URL 첨부 및 연동 데이터 처리 - 대용량 파일, 민감 데이터 통합 방법
- Rick and Morty JSON 전체를 받아 저장 후 업로드/시각화; API를 통한 대용량 데이터 업로드 절차 실습.
- PDF, 이미지 자동 처리(OCR, 마크다운/이미지로 자동 변환), URL 업로드(예: Berkshire Hathaway 투자자 편지 분석).
- 외부 커넥터(Gmail, Notion 등)와 UID 연동으로 다양한 데이터 소스를 손쉽게 활용 가능.
- 이미지 인코드 후 버그제보를 받고 Manus가 자동으로 문제를 분석하게 하는 실습 사례 제시.
타임라인, 대시보드, 복잡한 웹앱 자동화까지 매끄럽게 지원하는 구조적 강점
- 데이터셋 및 문서(PDF, 이미지 등) 연동만으로 테이블, 차트 등 시각화 웹페이지를 Manus가 스스로 생성.
- 웹앱 컨테이너는 Docker 기반이라 Redis, BooMQ, Stripe 등 서드파티 앱을 자유롭게 설치 가능(기본적으로 웹훅/autoscale 지원 예정).
- Stripe 등 복잡한 외부 결제·연동플랫폼 API 연결도 자동으로 웹훅/테스트 환경 조성.
- 단일 API를 통한 MVP(최소 실행제품) 개발, 복잡한 웹앱 프로토타입 자동화가 가능하게 설계됨.
웹훅(Webhook) 기반 대규모 태스크 비동기 처리 지원
- polling은 소규모 테스트에 적합, 실제 서비스화/대량 태스크 처리에선 webhook(태스크 완료/시작시 자동 콜백)이 필수.
- modal 등 파이썬 서버에 FastAPI 엔드포인트로 웹훅을 받아 처리; 여러 태스크를 한꺼번에 효율적으로 런칭·관리 가능.
- 태스크 생성/완료시 Manus가 웹훅으로 알림 → 서버 측에서 후처리나 사용자 응답 자동화 가능.
Slack 연동 - 실전 슬랙봇 구축 및 멀티턴 대화 구현 과정 상세 공개
- Slack 앱 등록 및 Signing Secret, Bot Token 준비 후, 이벤트 구독(Challenge, 인증), 기본 webhook 엔드포인트 세팅 시작.
- 메시지/스레드 식별자(thread_ts)를 태스크와 맵핑, 단일 스레드 내에서 멀티턴 대화/명령 가능(문맥 지속).
- 파일 업로드, 멘션, 블록 UI(버튼, 마크다운 등) 적용, 슬랙만의 마크다운 양식 맞춤 적용 등 실전 노하우 설명.
- 키밸류 딕셔너리(Modal Dictionary 등)로 대화 상태 관리; 데이터베이스, KVStore 등 확장 방안 언급.
- 태스크 실행부터, 응답 결과를 Slack의 동일 스레드로 재전송하는 전체 패턴 반복 구현(실제로 코드 디버깅, 버그 수정 등 과정 생생히 중계).
다양한 외부 플랫폼(노션, 크로마, Stripe 등)과 API 통합 확장성 사례 다수 제시
- Notion에 저장된 회사 정책 문서를 실시간 조회/참조하여 청구/영수증 처리 자동화.
- Chroma DB(임베딩 DB)와의 연동, 외부 API 키만으로 복잡한 데이터 매칭 및 추천 기능 생성.
- Stripe, Redis 등 Docker 기반 설치가 가능한 인프라에서는 복잡한 인프라 없이 다양한 확장 가능.
- 긴급 실시간 태스크나 회사 내부 정책 변화 등 다목적 활용이 손쉬움.
유저 프라이버시 및 데이터 보안 처리 방식 원칙화
- 모든 데이터는 미국 내 보관, 개인정보 및 기록은 사용자가 공유 의사를 밝히지 않으면 열람 불가.
- 업로드 파일은 48시간 이내 자동 삭제 및 사용자 직삭제 가능, 수동 삭제도 지원.
- 실시간 문제 해결이나 디버깅 목적 외에는 어떠한 형태로도 인적 열람/공유 불가 정책 설명.
실시간 Q&A 및 확장 로드맵 공유 – 사용자 맞춤 대화·기억, 내 브라우저 연결, 포맷 변환 등 순차 제공 계획
- API 셋업은 웹앱 활용을 통해 초기 습득(샌드박스 경험) → 반복 프로토타이핑 후 실제 API 확장 방식 권장.
- 기억(메모리) 저장/불러오기/임시모드 등은 현재 미지원, 향후 지원 예정.
- MyBrowser API화, 사용자 승인(권한) 고도화 기능, PPTX·PDF·마크다운 등 포맷 자동 변환, Slack 내 멀티미디어 메시지 렌더링 등 단계별 업데이트 계획 공개.
- 가장 많은 활용사례는 리서치, 데이터 분석 자동화, 정부 사이트/행사정보 자동 추출(예: 싱가포르 예약사이트 자동화, Selenium 병렬 크롤링 등).
- 실시간 피드백, 추가 개선/채용 문의 등 오픈(문의처: IvanLiu at Manus.ai).