영상 링크: LIVE AI Coding Challenge - YOU Choose What I Build (Using Kiro!)
채널명: Cole Medin
라이브 AI 코딩 챌린지 - 여러분이 선택하는 제가 만들 프로젝트 (Kiro 활용) 핵심 요약
- 본 영상은 시청자들이 실시간 투표를 통해 만들 프로젝트 아이디어를 직접 제안·선정하고, Cole Medin이 바로 그 자리에서 Kiro(키로) 등 최신 AI 코딩 에이전트를 활용해 실제 개발하는 ‘라이브 AI 코딩 챌린지’ 콘텐츠임
- 시청자들은 전용 어플리케이션(워드클라우드 투표/아이디어 제출)을 통해 자신이 원하는 프로젝트 아이디어(예: 음성 비서, CLI 도구, Fridge 콘텐츠 기반 레시피 추천 등)와 타인 아이디어에 대한 투표를 자유롭게 참여할 수 있음
- 채팅과 투표를 통해 연결된 주요 키워드는 ‘voice’, ‘CLI’, ‘agent’, ‘assistant’, ‘fridge’, ‘obsidian’ 등이며, 최종적으로 “Obsidian 지식베이스와 음성 및 텍스트로 대화 가능한 Voice Assistant Web 앱”을 구현 아이템으로 선정함
- 라이브 해커톤 분위기 속에서 Kiro, PyAndic AI, LiveKit, Whoosh 등 최신 AI 코딩 프레임워크와 도구를 활용해 기획부터 설계, 구현, 테스트 및 배포까지 전 과정을 실시간 시연함
- 개발 과정을 PIV 루프(Plan-Implement-Validate) 방식으로 체계화하여, 설계–구현–검증을 반복해나가며, 글로벌룰(steering docs), 구조적 플랜, 단계별 작업 내역, devlog, 명령어 및 환경 변수 관리법까지 실제 실무적인 노하우를 상세히 공개
- Obsidian 지식베이스 탐색(Whoosh 검색), 프론트엔드(React+Vite), 백엔드(Python+FastAPI), 음성 에이전트 연결(LiveKit), Agent Browser 기반 UI Self-Validation 등 통합적 구축·검증 프로세스를 설명
- 실시간 중단/오류/포트 충돌/잘못된 모델 설정 등 다양한 현장 문제 및 반복 개선 사례(시스템 에볼루션, 원인별 조치, 커밋/배포/청소 등)는 실제 AI 에이전트 코딩과정의 현실적인 난점과 개선법을 보여줌
- 개발 결과물(Obsidian 음성 에이전트)은 실시간 음성 대화, 텍스트/음성 검색, 문서 요약 등을 지원하며, 코드 전체 및 개선과제/후속 아이디어(라그 파이프라인 도입 등)까지 공유
- 영상 전반부에서는 Dynamis Hero 해커톤(총상금 1만7천달러, 1/30 마감) 소개와 결합된 태마로 각종 Agentic Coding 실무 팁, 코드기반 장기 기억 관리, Agent Browser 자동화 이유 및 차별점 등도 강조
- 방송 종료 전 완성된 실서비스 레포(Github) 주소와 devlog·README 등도 즉시 공개하였으며, 시청자들의 참가와 피드백, 후속 기능 개발·협업 의지도 유도함
세부 요약 - 주제별 정리
이번 라이브 코딩 챌린지의 목적과 진행 프로세스는 실시간 대중 주도 아이디어 선정 및 실제 구현에 있음
- Cole Medin은 사전 기획 없이, 시청자들이 제시 및 투표한 아이템을 그대로 ‘AI 코딩 에이전트’로 개발해보는 OS 방송 형태로 각 단계의 실제 현장을 시연
- 5~10분간 시청자가 충분히 모일 때까지 자유 채팅 및 참여 유도(접속 국가 등 공유)
- 전용 ‘투표 앱’ 워드클라우드에 누구나 아이디어를 입력하고, 중복 단어·키워드는 자동 집계/집합하여 인기 아이템으로 부상
- 투표 앱은 로그인 불필요, 여러 아이디어 제출 가능(스팸 억제 권고), 아이디어와 투표 분리 허용, 전체 흐름은 자유·실험적 방식 추구
- 방송 중 제안된 아이디어 예: “냉장고 내 재료 기반 레시피 추천”, “Obsidian 대화형 비서”, “다국어 음성 기반 개인 비서”, “투자 포트폴리오 분석기” 등 구체·실용·기술적 난이도 모두 반영
- 인기 키워드(voice, CLI, agent, assistant, obsidian 등)가 워드클라우드 상위 랭크, 이후 중복·스팸/투표 조절로 최종 아이템 조율
Obsidian 음성 에이전트: 아이디어 선정에서 실구현까지 ‘사용자 주도형’ 원칙 적용 및 프로세스 상세 공유
- 최종으로 선정된 빌드 아이템: “Obsidian 지식베이스와 음성/텍스트로 자유롭게 대화하며, 문서 탐색·요약·검색이 모두 가능한 AI 기반 Voice Assistant Web앱”
- 유사 플러그인(Obsidian 커뮤니티 내 voice agent/assistant 등)의 기능 미비, 실질적 음성대화/문서기반 AI Agent 기능 부재 확인
- 사용 기술: 백엔드 Python(FastAPI), 프론트엔드 React+Vite, 음성 에이전트 LiveKit, AI 프레임워크 Kiro·PyAndic AI, 검색엔진 Whoosh
- 향후 아이디어: 향상된 검색/라그 파이프라인 도입, 제로샷 커스텀 기능, UI/UX 개선 등 자유롭게 제안·논의
Agentic Coding 실무 워크플로우(PIV Loop), AI 개발 자동화 및 Context 관리 전략을 실제로 전수함
- 코딩 에이전트 기반 ‘Plan→Implement→Validate’(PIV) 루프:
- Plan: 전체 목표, 아키텍처와 기술스택, 인터페이스·기능 기획, 스티어링 문서(글로벌 룰), 요구사항 정리
- Implement: 매 루프별 세부 기능 단위로 개발(툴 레이어, 텍스트 에이전트, 프론트, 이후 음성 에이전트 구축 순)
- Validate: 자동/AI 기반 테스팅 및 수동 검증 결합(Agent Browser/E2E, 스크린샷 활용 등)
- 매 단위별 구조적 Plan 문서/Markdown 생성, 커맨드이력, devlog 기록 후 다음 루프 진입
- Kiro의 스티어링 도큐먼트(Global Rule)와 AquaVoice, 커맨드 기반 아키텍처 구성을 세부적으로 시연
- Project Setup: 다양한 ENV 변수, 디렉토리/폴더링 관리법, 기능별/에이전트별 코드 분리 원칙 제시
RAG(검색 기반 증강) 미적용 상태, Whoosh 검색엔진 활용 및 향후 개선 포인트 공개
- 본 라이브에서 RAG(embedding, 벡터DB)는 단순화 차원에서 적용하지 않고, “Whoosh” Python 라이브러리로 순수 마크다운/텍스트 기반 탐색·검색 진행
- Whoosh의 장점: BM25 랭킹, fuzzy match, sub-second 쿼리, 자유로운 패턴 검색, 인프라 부담 최소화, 작은 프로젝트에 적합
- 이후 개선 사항으로는 벡터DB/Embedding 기반 RAG 파이프라인 도입, 검색정확도/스케일 향상, Obsidian 지식베이스 최적화 등 언급
실시간 문제 발생 케이스 및 AI 코딩 에이전트의 한계와 시스템 에볼루션 접근법 실제 적용
- CLI 관련 오류, 포트 충돌, Agent 명령어 오동작, context window 부족, 누락된 end-to-end validation, 프론트/백엔드 프로세스 중복 등 다양한 실시간 예외/중단상황 발생
- 즉시 채팅·코딩 에이전트와 대화로 원인 파악→계획·룰·명령어 개선 및 시스템 에볼루션(시스템 내 반복적 오류의 영구 개선)을 실전에서 시범
- 실무 자동화에서 발생 가능한 문제(Agent 자체적 서비스 종료 미수행, 계획단 누락, 컨텍스트 블로트, 잘못된 코드/설정, 로그 및 스크린샷 활용법 등) 구체 예시
Kiro(키로), LiveKit 등 최첨단 AI 코딩 도구 활용 및 장단점/대안 비교(Claude Code, Playright, Agent Browser, Convex 등)
- Kiro: 빠르고(속도), 커맨드 기반 워크플로우, 스티어링 문서 활용, 서브에이전트 분기, Agent Browser와 결합한 프론트엔드 자기 검증 구현
- Claude Code: 코드 품질, 자동화·Validation 성능, 장기기억지원 등 비교 우위 점도 솔직하게 언급
- LiveKit: 오픈소스, 자체 호스팅 무료 가능, 음성/실시간 채팅 에이전트에 최적화
- 기타 대체 도구/무브먼트: Convex DB, Supabase, Playright MCP, Agent Zero, AMP, N8N 등 비교 언급 및 적용범위 구분
수동/자동 테스트, 브라우저 E2E Validation 및 실제 서비스 배포 절차 상세 공개
- E2E(End to End) 검증 자동화: Vercel Agent Browser의 역할 및 Playright 대비 토큰 효율, 사용 메리트 설명
- 구조화된 플랜 내부에 상세 validation strategy(시작/종료/포트 확인/스크린샷 등) 포함
- 수동 테스트 시나리오: 프론트/백엔드 직접 구동, 유저 인터페이스 실테스트, 음성–지식베이스 검색 응답 확인, 실제 화면 크롬 라이브 공유 등
Agentic 해커톤(1만7천달러 상금), 개발 과정/Devlog/글로벌룰/명령어 등 제출 가이드 및 평가 기준 설명
- Dynamis Hero Hackathon 특별 소개: 500+2000 무료 Kiro 크레딧 증정, 자유로운 주제, 개발·문서·Devlog·스티어링 문서·명령어 제출 필수
- 신규 마감일: 1월 30일(기존 23일에서 1주일 연장), 최종 발표 및 안내 라이브 스트림 2월 14일 진행 예정
- 코드/커밋/Devlog 주기적 관리, 효율적 장기 기억 구현, 제출시 주요 평가 관점(자동화/설계/문서) 안내
프론트/백엔드/음성 인터페이스의 실제 구성과 복수 에이전트 연결법 공개
- backend: Python FastAPI 기반 Agent 툴킷, Whoosh로 Obsidian 마크다운 기반 문서 검색 구현
- frontend: React+Vite로 Minimal UI, 텍스트/음성 전환, 대화내역 및 파일 레퍼런스 연동(개선 필요)
- 음성Agent: LiveKit 통한 실시간 voice 대화, Deepgram/OpenAI·Speech-to-Text 쌍방향 처리, 지식베이스 연동 검색형 음성인식 구현(모델별 속도/비용/품질 차이 실험)
- Pydantic AI Agent(텍스트), LiveKit Agent(음성), Agent Browser(자기 검증), 각기 독립적이면서도 공통 툴을 재활용하는 구조
실시간 데모·결과물 시연 및 완성 코드베이스 공개, 향후 협업/개선 지점 제안
- 부하/지연/잘못된 모델 설정(예: GPT4 의도치 않은 할당, 실시간 모델 선택), 청취·인지 오류, UI 미흡 등은 기능 개선 과제로 남김
- 누락 기능 및 후속 개선 시나리오: RAG pipeline, UI/UX 업그레이드, 검색 엔진 개선/메타데이터 강화, ENV 환경 변수 파라미터화, Obsidian 플러그인화 가능성 등
- GitHub 레포 링크 실시간 공개, devlog/README 최신화, 시청자 직접 체험 및 커뮤니티 협업/리팩토링 유도
AI 코딩 에이전트 실무의 현실·한계·기회와 교육/커뮤니티 소개
- Agentic Engineering(에이전트 기반 개발)의 급성장, 전문가 필수 기술로 부상
- Agent 코드 자동화의 한계(오류, 맥락 오류, 반복 개선 필요성 등)도 숨김없이 노출
- Dynamis 커뮤니티 및 Agentic Coding Course 교육 프로그램, 효율적 시스템 진화/관성 관리 기술, 글로벌 룰 관리 및 실무 노하우 안내
- 라이브 내내 시청자 Q&A, 세부 툴/경쟁 프레임워크 비교, 각종 개발 팁/일치 사례 대거 공개
전체 과정 요약 및 커뮤니티 피드백, 과제, 마무리
- 3시간 이내에 기획–설계–구현–검증–배포까지, 실시간 AI Agentic Coding이 어떻게 현실적으로 작동하는지 best practice 및 오픈 코드와 함께 체험 제공
- 방송 내내 시청자와 투표·Q&A·현장 참여 방식의 커뮤니티 드라이브, 다음 챌린지/공동 개발까지 확대 가능성 암시
- 완성 후 레포·코드·문서 모두 공개, 지속적 개선·기여 제안하며 해커톤 참가 및 교육 프로그램도 안내