Minimax M2 - Olive Song, MiniMax

영상 링크: Minimax M2 – Olive Song, MiniMax
채널명: AI Engineer

Minimax M2 – 미니맥스의 새로운 100억 파라미터 코딩 특화 모델 핵심 요약

영상 제목: Minimax M2 – 미니맥스의 새로운 100억 파라미터 코딩 특화 모델
Olive Song이 Minimax 플랫폼의 최신 오픈 소스 AI 모델인 Minimax M2를 뉴욕에서 소개하며, 자신의 RL(강화학습) 및 평가 연구 경험을 바탕으로 발표함
Minimax는 기반모델(foundation models)과 다양한 응용(agent, 비전/음성/비디오/음악 생성)까지 자체에서 모두 개발하는 점이 독자적인 차별점임
M2 모델은 활성 파라미터 100억 개로 매우 작고, 특히 코딩 및 직장 내 에이전트 작업을 위해 설계됨
M2는 오픈소스 모델 중에서도 인텔리전스 벤치마크 및 에이전트 벤치마크에서 최상위권 성적을 기록함
출시 1주 만에 오픈라우터(OpenRouter) 토큰 사용량 상위 3위, 다운로드 최다 기록 등 커뮤니티 반응도 우수함
성능 특징으로는 ▲확장된 환경 및 전문가 피드백 기반의 견고한 코딩 경험, ▲복잡한 장기(workflow) 과제 대응, ▲다양한 에이전트 스캐폴드(구조)에 대한 강인한 일반화, ▲높은 에이전트 확장성 및 비용 효율성 등이 강조됨
향후 계획으로 M2.1·M3 개발, 더 나은 메모리/맥락 관리, 다양한 미디어(오디오/비디오) 생성 통합 등이 언급됨

M2는 복잡한(“long horizon”) 워크플로우에서 여러 툴을 결합해 사용하며 추론하는 작업을 자동화
인터리드 씽킹(interleaved thinking): 한 번의 툴 호출이 아닌, 여러 번에 걸친 순환적 툴 호출/추론을 반복(수십~100차례 가능)
사람이 환경 피드백을 분석하고 행동을 반복 조정하는 것처럼, 환경 잡음(noise)이나 오류, 예측 불가 상황에도 능동적으로 적응
실제 예시로 주식 시장 변동 등 환경 교란(perturbation) 조건에서도 일관성 있게 동작했음을 언급
Gmail, Notion, Terminal 등 실제 워크플로우에 단일 모델 호출만으로 통합적 자동화가 가능함

여러 툴을 학습시킨 것만으로는 미접촉 환경·스캐폴드에 일반화가 제한됨
실제 모델 운용 공간(툴 정보, 시스템 프롬프트, 유저 프롬프트, 챗 템플릿, 환경 등)에 데이터 교란(perturbation)을 체계적으로 주입
다양한 환경 변화·구조를 반복 훈련하여, 사전에 본 적 없는 신규 툴·구성·스캐폴드에도 견고하게 적응하도록 설계
이를 통해 모델의 현장 적용성 및 미래 확장성을 획기적으로 강화

M2는 경량화·최적화로 인해 복수 에이전트 동시 운용, 병렬 처리, 장기 에이전트 활용 등 대규모 에이전트 오케스트레이션에 적합
자체 개발한 Minimax Agent 애플리케이션에서 다수의 M2 인스턴스가 리서치, 문서 작성, 리포트 만들기, 프론트엔드 배치 등 역할을 분담
높은 비용 효율성과 성능 덕분에 실제 업무 자동화 및 생산성 극대화에 유리함
현장 데모 및 QR코드를 통한 직접 체험도 영상에서 안내

후속 모델(M2.1, M3)에서 메모리 향상, 문맥 관리, 사전적 AI(프로액티브 AI), 전문분야(워크플레이스 vertical experts) 적용 등이 목표
자체 강점인 오디오, 비디오 생성 등 멀티모달 기술과의 통합도 추진
방대한 데이터, 알고리즘, 전문가 평가, 모델 아키텍처, 추론 및 평가 등 집대성한 역량을 커뮤니티와 공유하고자 함