
영상 링크: AI Engineer Paris 2025 (Day 2)
채널명: AI Engineer
AI 엔지니어 파리 2025 (Day 2) 핵심 요약
- AI Engineer Paris 2025 둘째 날 컨퍼런스는 다수의 글로벌 연사(35명+)와 기업, 스타트업이 참여하는 5개 트랙, 500건+ 발표 제안, 다양한 부스와 워크샵으로 규모 있게 개최됨.
- 에이전트, MCP 프로토콜, 오픈 모델, 생성형 미디어, 인프라 등 AI 최신 기술 및 실제 적용사례를 심도 있게 다룸.
- Neo4j의 CEO Emil Eifrem은 미래 AI 애플리케이션 데이터 계층의 4가지 핵심 요건과 이를 위한 그래프 기반 접근, 실 사례 및 데모로 설명.
- Docker VP Tushar Jain은 “에이전트는 새로운 마이크로서비스”라는 비전 아래, 에이전트 패키징(CAgent) 및 MCP 서버 신뢰·표준 카탈로그 구축 진척 소개.
- GitHub VP Martin Woodward는 MCP 프로토콜 발전사, 실전 운영 경험, 도구 동적 선언, 보안·인증, 신규 오픈 소스 MCP 레지스트리 등을 상세히 공유.
- COB CEO Yan Leger는 AI 에이전트 시대의 인프라 변화(다양한 하드웨어, 샌드박스·스케일투제로), 실제 대규모 안전 운영을 위한 기술 스택 및 병목 관리 방법을 구체적 매커니즘 차원에서 시연.
- Black Forest Labs 공동창업자 Andreas Blattmann이 선도적 이미지 생성·편집 모델 Flux의 원리(특히 Latent Flow Matching 및 Adversarial Diffusion Distillation)와 가장 빠른 inference 달성 방법, 생태계 규모·데모 공개.
- H사 CTO Lawrence는 컴퓨터 UI 기반 에이전트(래퍼적 자동화, 전문화 모델 OLO)의 필요성과 강점, 현황·벤치마크, 오픈웨이트 공개 의의, 실제 사용자 시나리오 구체 도출.
- Neo4j, HuggingFace, Arise AI, ZML, Llama Index, Google DeepMind, Qout 등 AI 산업 리더 기업들이 AI 실용화, 열린 생태계, 인프라, 도구/표준, 모델·앱 개발 지원 프로그램, 커뮤니티 참여 강조.
- 실제 현장 데모 및 코드, 데이터, 패키지, 오픈 레지스트리 등 현업 활용 가능한 구체 리소스 제시, 누구나 시작해볼 수 있음을 강조.
- 각 세션마다 현업의 실제 과제·트렌드·애로사항 중심으로 실질적 인사이트와 구체적 대응 방법 공유.
세부 요약 - 주제별 정리
컨퍼런스 구조와 주요 행사, 운영 방식이 업계의 새로운 협업·학습의 장을 제공함
- 5개 트랙, 35명+ 연사, 글로벌(미국, 스웨덴·독일 등) 참가자, 500건+ CF 제출, 500명+ 규모 등 대형 행사로 구성됨.
- 다양한 부스와 스폰서 참여(예: COB, Docker, Neo4j, Arise AI, HuggingFace 등), 모두 현장 교류와 네트워크 중심으로 운영.
- 앱을 통한 트랙/세션 정보 확인, 부스·워크샵·카페 등 자체 인프라 지원, 참가자-스폰서-엔지니어 간 연결을 독려.
- 모든 세션은 기록/유튜브 업로드 예정으로, 지식 공유 강화.
- 스폰서십은 Sentry, Arise AI, DeepMind, Algolia, Docker(플래티넘), Neo4j(플래티넘) 등 다양한 수준의 지원/연계.
Neo4j CEO: AI 애플리케이션 데이터 계층은 실질적 ‘4대 속성’을 충족해야 혁신적 응용이 가능함
- “AI 중심의 데이터 계층은 구조화·비구조화·반구조화(3종) 데이터를 단일 레이어에서 처리, 저장, 검색, 트랜잭션 범위로 관리할 수 있어야 한다.”
- 단순 벡터DB의 한계(시맨틱 검색만으로 부족) → 구조화/비구조화 데이터의 융복합 필요성 제시.
- 엔티티 추출·연결의 예시(Andreas/He/ABK → Named Entity Recognition, Entity Resolution)는 향후 AI앱 개발의 핵심 기법이 됨을 강조.
- 실시간/통합 조인(앱 내 데이터, 랙 코퍼스, 에이전트 메모리 간)을 데이터 계층에서 제공해야 성능/복잡성/신뢰성 문제를 근본적으로 해소.
- 1st party(직접 수집) 데이터와 파생(derived, 예: 랙에서 온 가이드 등) 데이터의 명확 구분/통제 기능 필수(예: 마크업, 변경·배포 정책).
- 위 4대 속성을 실제로 구현하기 위한 Neo4j의 진행 상황을 짧은 데모(위키피디아 파리 문서→지식그래프화, 엔티티 추출/검색)로 시연.
- “미래의 대규모 AI 앱은 이러한 데이터 계층 위에서만 가능하다”는 비전을 객관적·구체적으로 제안.
Docker VP: 에이전트 시대엔 ‘에이전트 표준 패키징·카탈로그·보안 생태계’가 SaaS/컨테이너 못지않게 중요
- 에이전트를 단일 마이크로서비스처럼 컨테이너화하여 패키지를 표준화(CAgent 도구, Agentfile 개념 등), OCR registry/hub로 공유·배포·재사용을 실험 중.
- MCP 서버(기능 서버)도 컨테이너 패키징, 신뢰 검증 및 공식 카탈로그 제공(MCP toolkit, Docker Desktop의 UI 통합 관리/연동).
- 공식 hub 내 MCP 서버/에이전트의 신뢰도, 버전 관리, security(루그풀 등) 기능 중심의 생태계 구축.
- Notion→GitHub issue 자동 등록, 도구/비밀값 구성, 오플리셜 MCP 서버, 워크플로우 자동화 데모 실행.
- 향후 standardized packaging, agentfile, 보안 추가 예정. 커뮤니티 피드백 적극 수렴 의사 표명.
GitHub VP: MCP 프로토콜의 실제 도입·운영 경험에서 얻은 ‘도구 선언’, ‘동적 탐색’, ‘보안 인증’, ‘레지스트리’의 실전 교훈
- CoPilot의 초창기~2025년 현재 1,500만 명+ 사용 현황, 기능호출(function calling, 2023.6 첫 등장)→확장성 기반 도구에 최적화.
- MCP(Multi-Client Protocol): 도구 선언/발견, 리소스 단독 접근, 서버-클라이언트 상호 작용(샘플링, 루트, 유저 LLM 활용), 프롬프트, dynamic discovery, elicitation(질의/의사결정 수렴 등) 포함.
- 실제 도입 시 최대 교훈은 도구 과다 제공시 LLM 혼동·성능 저하(LangChain의 연구 데이터). → 다이내믹 도구 탐색·동적 활성화/비활성화 지원이 중요.
- 설치·업그레이드·호환성 문제: 로컬 MCP는 개발 단에서 가장 빨라 실험에 좋으나, 실제 서비스/엔터프라이즈에선 원격 MCP 서버, 공식 인증 절차, OAuth 기반 통합 인증 필수.
- 오픈 MCP 레지스트리(2025년 2주전 출시): 중앙 API/레포/인기도 등 신뢰 기준 제공, 개별/기업/커뮤니티 각각 독립적 등록소 분산 권장(독점 방지, 보안/트러스트 제어).
- LLM의 MCP 서버 구축은 코드 몇줄도 가능(VSCode가 유일하게 스펙 전부 지원), 실제 상용화 고려시 보안·업데이트·자동화 중요.
- 학생/주니어 개발자 교육에도 올바른 MCP 생태계 습득과 팀 기반 시너지 강조.
COB CEO: 에이전트 중심의 AI 인프라는 ‘다양한 하드웨어, 샌드박스, 고속 부팅, 비용 최적화, 보안’이 핵심 조건
- AI 클라우드 인프라는 초기 LLM-GPU 중심 단순 구조(2023년)→2025년 Agent, VLM, 비전/코딩 모델, MCP, 다양한 하드웨어(GPU/CPU/Accelerator) 공존의 복합 생태계로 진화.
- 각 워크로드별 하드웨어 타입(대형훈련 GPU, 소형 튜닝/추론엔 AMD·새 Accelerator, Agentic는 CPU 등) 구체 제시.
- 에이전트 탑재시 샌드박스(비신뢰/비결정적 코드), 고속 에페머럴 환경(잠깐 실행 후 소멸), 대량(일일 10,000개+) 동시 컨테이너 자동 배포·격리 필요.
- 병목 포인트는 네트워킹, 이미지 풀링, 런타임 기동 등. 프리엠티브 부팅, 이미지 캐시, 네트워크 최적화로 극복.
- 사용되지 않는 에이전트 리소스 고효율 관리 위해 ‘scale to zero’, ‘autoscaling’, 메모리 스냅샷(100~200ms 재기동) 등 첨단 기법 적용.
- GPU 샌드박스에도 확장, AI 개발자들이 손쉽게 안전한 대규모·꿈의 속도 환경 조성 가능함을 지향.
Black Forest Labs: Flux 모델은 텍스트-이미지 생성/편집 모두에서 신규 알고리즘으로 ‘초고속·초고품질·대규모 생태계’ 구축
- Flux 모델은 BFL(2024년 4월 설립, 8월 런칭, 40명/독일+SF), 텍스트-이미지 생성+편집, 오픈소스/프리미엄 3단 구조 제공(Flux Pro(API상용), dev(오픈가중치), Chanel(경량/입문)).
- 오픈파인튜닝/로라 생태계, HuggingFace 기준 업계 최대 세부 튜닝 사례로 증명.
- 기존 제품<->이미지 편집 기능 통합(Flux Context, 2025년 6월공개), 캐릭터 일관성·스타일 변환·로컬·글로벌 편집·스케치→렌더·비즈니스 활용 등 폭넓은 usecase.
- 근간 원리: Latent Flow Matching(고효율 잠재공간 생성), Adversarial Diffusion Distillation(교사-학생 네트워크·수십 배 속도화, 디코더 최소화).
- 실제 데모: 축구 유니폼→로고 위치·배경 변화→스타일 변환→사람화→회화화 등 수 초 내 실시간 파이프라인.
- 이론적: 대규모 모델일수록 1-step generation 도달 가능, 고차원 변환 함수 표현력 제공(속도/품질 동시 혁신).
- 오픈웨이트와 상용모델 구조 병행, 커뮤니티/연구/실제 현업 영동 커스터마이징 모두 지원.
H사 CTO: 인간 수준의 자유로운 컴퓨터 UI 자동화 ‘에이전트’는 범용 LLM보다 특화·오픈모델로 실제성과 비용 효율성 모두 극대화
- 컴퓨터 사용자 에이전트: 실제 인간과 동일 방식(화면 캡처+마우스/키보드 동작), RPA와 달리 유연성·복원성·길항적 엔터프라이즈 환경까지 처리 가능.
- UI 기반 다중 사이트/앱 조작 데모(구글 플라이트: 날짜·환승·달력 검색·드롭다운 조작·입력·분류 등)—기존 RPA 대비 1프롬프트, Adaptivity/TR, 서버·로컬 가능한 OLO 모델 제공.
- 실제 성능: WebVoyager 벤치마크(600개 실험), GP(T)계열 대모델 대비 5x 이상 비용 효과, Localization 특화 모델은 범용 VLM보다 Substantial하게 outperform. 파트로 프론티어 증명.
- 훈련: 오픈 OLO(Quen 2.5VL 파인튜닝), 직접 데이터를 모아(Screenshot-Intent-Coordinates), SP/QA/Mu dataset·synthetic trajectory·RL(RPO)까지 단계별 적용.
- 오픈웨이트 전략: 신뢰성·재현성·적극적 커뮤니티·고객 독립성·기술적 정직성·직원 동기 강화 등 다차원적 이점.
- 실제 연구는 Web→Desktop/Mobile로 확장, 오류 사례·카테고리 분류, 인간+AI 학습 강화, 앞으로 Surf showcase/Portal 공개(추론 API, 웹 인터페이스).
- 비즈니스 모델은 가치 기반(건별 과금 아닌 소비 증대 대비 일부 차지). 실제 배포 시 권한·사용자 동의·보안 등 다양한 이슈 구체적 논의.
Neo4j/다중 에이전트 구조 데모: 데이터 지향 ‘그래프 RAG 에이전트’의 설계, 다중전문화/휴먼인더루프·자동화의 실제 절차 공개
- 데이터 그래프 구축을 위한 멀티에이전트(사용자 의도 이해 → 데이터 원천 스캔/추천 → 데이터 모델 제안 → 그래프 생성 → 쿼리 추천 등) 설계 구현.
- 각 에이전트는 구조화/비구조화/그래프 RAG에 특화, 일반 대형 모델 보다는 특수형 모델 활용 시 성능 및 유지성이 비약적으로 향상.
- 실제 영상 데모 : BOM(구성품) 그래프 설계·승인·생성→쿼리 수행→Neo4j 데이타베이스 내 연결관계 시각화까지 full-run 제공.
- 오픈 소스 전체 코드 제공, 도입 엣지 케이스·실전 활용법 공유.
HuggingFace: 오픈 LLM은 이미 ‘일상적 실전 수준’, 높아진 품질/접근성/효율성/확장성/프로덕션 지원까지 실현
- 오픈 LLM(Deepseek R1, Quen 등)은 벤치마크(평균점수/절대점수) 기준 Proprietary 대형모델(GPT-5, Claude Sonnet 등)에 근접. 일부 세부 태스크에서 상회.
- 실제 성능지표: GPD-5 high(67점), GPD-OSS(58점), 대다수 오픈모델 10위권 진입.
- 접근 방식: 즉시사용 API/Managed 배포/직접 배포(내부 GPU/클라우드) 3단계, 2025년 현재 Chat Completions 등 인터페이스 표준화로 개발/운영 쉬워짐.
- 신뢰성/유연성(예: Anthropic 장애 사례, “Not your weights, not your brain”)
- 트렌드(2025): Reasoning 표준화(DeepSeek R1 COT 오픈→작은 모델 디스틸→추론 모드 전파), 컨텍스트 창 확대(128K→100만~1천만), 운영/성능 효율화(Quant 4bit, ChatML 포맷, 툴콜/SCALING), 비용 급감 그래프.
- 제한점: 범용 추론(General Reasoning), End-to-End Multimodal은 아직 Proprietary모델(특히 OpenAI) 우위. 안전·가이드라인/Jailbreak scaffolding 필요.
- 도입 전략: “오픈 우선”, 동일 테스트셋 결과 비교, 프롬프트 조정→실전 도입을 적극 권고.
Arise AI: ‘시스템 프롬프트 학습(Prompt Learning)’으로 에이전트가 실환경서 스스로 진화해야 실효적 성과 가능
- 현장 피드백(온라인 ver eval, Hacker News 등): 에이전트는 고정 프롬프트/계획/도구/컨텍스트에서는 금방 망가짐, 진화형 프로세스 필수.
- Andrej Karpathy의 System Prompt Learning(가장 인간처럼, 프리트레이닝·파인튜닝과 달리 ‘즉각적 예외 피드백’을 시스템 프롬프트에 직접 추가)
- 실제 Coding Agent(Codellama 기반) 사례: Sweetbench 등 코드 버그 수정 태스크, 초기 프롬프트+룰 없는 상태(31% 정답률), 에러시 해설 달아 LLM이 룰에 영어로 규칙 추가→Prompt Iteration수차례→max 45%로 15%p+ 상승.
- 설명형 피드백+분류화된 Error(summary설명)을 Prompt로 루프, 실제 성능 지표/Train/Test/Blind를 실시간 체크하며 overfitting 방지.
- Prompt Learning은 딥스파이 등 기존 Prompt Optim 프레임워크보다 설명/다차원 정보, Self-improvement에 더 가까움. 앞으로 자동화형 prompt optimization 추세.
- 적용 범위: 코드 에이전트뿐 아니라 Structured JSON/Wep페이지 추출/고객분류 등 다양한 Task에서도 Accuracy 수직 향상 입증.
- 시스템 설계: Human-in-the-loop Evaluations, 지속적인 Online Eval 및 Auto-iteration, Prompt 성능 비교를 통한 최적 운영.
ZML: Transformer의 한계(N^2 Attention)을 ‘그래프화/분산 실행’으로 돌파, ‘실제 무제한 컨텍스트 + CPU/네트워크 적합화’ 진화
- Attention 구조의 본질(Softmax→Sparse→대부분 불필요 연산), 이를 ‘그래프 매핑’하여 유의미 노드만 연산 시 log(N) 복잡도로 개선.
- 기존 GPU는 분기(branching) 처리 나쁨→CPU가 유리, KV 캐시를 GPU에서 분리(시스템 메모리/네트워크 분산가능), 모델상 GPU만, KVC는 CPU/네트워크로 수직 확장.
- NVLink/Infiniband가 아닌 10G ethernet(16ms)=>kernel bypass(DPDK)로 이론치(16µs→20µs), 실제로 Fast path 구현, 대규모 모델을 단일 GPU(GPU 32B/32GB 위)에서 Unique하게 실행 성공(데모 : Attention만 죽이면 inference중지).
- 미래에는 Universal Chip지원/동시성/메모리 효율 극대화, 오픈소스 프레임워크로 커뮤니티, 초고성능·저지연 환경을 제공 목표.
Llama Index: 현실적 ‘노트북 LM 대체 오픈소스’ 패키지, 재사용·복합→MCP툴통합까지 실전 템플릿으로 공개
- Notebook LM의 전기능(파일업로드/문서요약/FAQ/마인드맵/오디오/플래카드/비디오/문서관리/문서채팅 등) 벤치마크로 3대 목표: 복잡문서 대응, 기능 재사용성, 워크플로우 제어.
- Llama Index 오픈소스 프레임워크·Llama Cloud 서비스 활용, Llama Parse/Extract 기능으로 업로드→구조 데이터화, 팬딕틱 스키마, 커스텀 구성/모델.
- 직접 작성한 Workflows 클래스(이벤트 기반, 단계 스텝별 입력출력, 모든 주요 로직 MCP tool call화), 추후 각 기능 단독 MCP서버/워크플로우 모듈로 outside 사용 가능.
- 마인드맵 자동 생성/문서 채팅/테이블 및 이미지 추출/팟캐스트 생성/관찰성(Observability) 연동.
- Demo: IKEA 주방 가이드 문서→Q&A·요약·마인드맵·FAIR 초반 노트북 자동생성→Document Chat 및 질의·인용 참조 자동 추출/설명/소스 판별.
- 개발프레임워크 우열은 개발자 경험, 연구 최신성, 관찰성 등 차원에 따라 선호차 존재.
- 커뮤니티 오픈소스이므로 자유롭게 기여/확장/조합 가능. Postgres는 mindmap 등 부가 데이터 로컬 저장용도로만 최소 사용.
Google DeepMind: Gemini·VEO·Genie 등 ‘다중모달/다형태/로컬 친화’ 모델군과 Buidl기능 등 AI 서비스 신경계를 선도
- Gemini 2.5 Pro/Flash/Image Preview(Nanobanana): 이미지/비디오/오디오/텍스트/코드/다국어 등 별도의 샘플 없이 멀티모달 입력+출력 일원화(예: Robotics·스마트글래스·음성그라운딩·학교 숙제·실시간 UI 탐색 데모).
- AI Studio: 실시간 SDK(GenAI, VertexAI) 통합, 자연어 프롬프트로 앱 스케치/배포(CloudRun), 시연(웹캠→DnD캐릭터+스탯생성→구글클라우드에 자동 배포).
- Gemini Live: 실시간 언어변환, 다국어 입력받아 상대 모국어로 구사, UI인식 및 질문 응답, 구글검색 연동, 코드 실행, 화면공유 등 일상적 업무 지원.
- Google Collab 내 자동 EDA/ML모델 자동 계획→코드→실행→결과해석 pipeline, 과거 scikit-learn 기준 본인 경험 대비 혁신적 설명.
- VEO3: 최첨단 동영상생성, 영상+프롬프트+음성 동시 생성/캐릭터 일관성/프레임 보간/아웃페인팅 등 확장, 실제 CF광고 스타일 제작 사례 시연.
- Genie3: 프롬프트/입력 이미지로 Immersive 3D월드 생성, 내부 상태 연속성/상호작용/환경 변화 반영.
- Gemma 3N 등 소형(4B~27B) 오픈모델, 1세대 Gemini(1.5, Pro) 능가, 로컬 호스팅/수백억 매개변수도 단일 H100서 실행, 크롬/모바일 내장·온디바이스 서비스 미리보기.
- 오픈 및 로컬 우선, 스타트업 혁신 친화(적은 인원으로 대규모 시스템 실현), 창업자 지원 프로젝트 강화 메시지.
Qout: 오픈, 저지연, 초실제감 AI 음성/음향 생성, 다방향·다기능(실시간 번역/청자변환/멀티발화/분리전사 등) 풀두플렉스를 실전 수준으로 선보임
- QAI: 파리 기반, 비영리 AI 연구소(2022 설립, Xavier Niel/Eric Schmidt 후원), 개방/협업/아카데미아 파트너십, 모든 산출물 오픈(코드/모델/HF/논문).
- 기존 TTS/ASR/변환/임직/에이전트 등 폐쇄형 → 다수 실시간 쌍방향, NPC, 맞춤형 미디어, 퍼스널 어시스턴트 등 대규모 상용화 기반.
- 품질지표: Full-Duplex 발화, 세계 최초 실시간 동시 대화, 중복·중첩 발화 자연처리(20% 겹침), REST/Speech2Speech+텍스트 에이전트 연결 등.
- 핵심: Mimi(초고압축 음성코덱), 오디오토큰 변환→LMM, Quadratic→Fast“라이트”화, Multi-stream modeling(프렌치→영어, 음성→텍스트 등 모두 동일 구조).
- 실전 데모: 강한 잡음 내/사무실, 실시간 번역(비행기 모드), 동시발화 인식/변환/출력, 실시간 전사, 타자-발화동시 출력 등 구체적 시연.
- 오픈: Pretrained 모델, 파이토치 코드, gradio/web UI 제공. LA Province, 맞춤형 청취 뉴스 등 실제 파트너링 중.
- 스케일: 1개 H100서 320 동시 대화, Whisper/Chatterbox 대비 100배+ Throughput, 낮은 메모리/실수율. 각종 데모 및 애플리케이션-파트너십 오픈 프로토콜/테스트 진행 중.
- 대규모 상용/비장사적 시나리오(게임, 고객센터, 에듀테크, 로컬 디바이스 등) 양방향/실시간/맞춤형 음성 AI에 대한 근간 인프라 추진.
전체 마무리: 커뮤니티, 인프라 기업, 프로덕트, 스타트업, 오픈생태계, 실제 운영과 현장 적용을 결집하여 AI Engineer시대 혁신 뒷받침
- 각 핵심 기업/연사/프로젝트들은 오픈소스/표준화/실천위주 지향, 실전 인프라/툴/API/레지스트리 바로 활용 강조.
- 엔지니어 간 교류, 직접 데모, 신속 피드백, 스타트업·학생·경력개발·기술 혁신 등 다양한 구성원이 공존하는 현장 전문성 확보.
- AI Engineer/Paris 2025는 미래 AI 혁신에 필요한 데이터 계층, 인프라, 표준, 자동화, 전문화, 오픈 모델, 실전 서빙·운영 기법, 그리고 커뮤니티의 실제 실행 동력을 모두 한자리에 집결시킨 것으로 결론.