Skip to content
Go back

Building voice agents with OpenAI - Dominik Kundel, OpenAI

Published:  at  05:19 PM
YouTube Thumbnail

영상 링크: Building voice agents with OpenAI — Dominik Kundel, OpenAI
채널명: AI Engineer

OpenAI로 음성 에이전트 구축하기 — 도미닉 쿤델(OpenAI) 핵심 요약


세부 요약 - 주제별 정리

모든 참석자가 이해할 수 있도록 ‘에이전트’ 개념을 구체적으로 정의함

TypeScript용 Agents SDK 출시 의미와 기존 Python SDK 대비 핵심 추가 기능 소개

음성 에이전트 도입 이유와 기존 텍스트 에이전트 방식과의 본질적 차이 설명

음성 에이전트 아키텍처: 체인 방식(chained)과 직접 음성 모델 방식별 장단점 구체 분석

실제 데모: 실시간 음성 에이전트 구현, 도구(tool)·백엔드 위임 및 디버깅 과정 시연

실시간 에이전트 개발 Best Practice: 명확한 범위 설정, 그라운드 트루스 확보, 사람 승인 등 강조

Step by Step 코드 튜토리얼: 텍스트→음성 실시간 에이전트로의 전환 과정 상세 안내

중요 고급 기능 및 실전 노하우: 대화 히스토리·메모리 관리, 비용 계산, 인터럽트 및 외부 시스템 연계

핸드오버, 에이전트 전환, 음성·말투·속도 조절 등 고급 시나리오 시연

멀티에이전트 위임 및 복잡한 추론 기능 현실적 구현법 안내

Guard rails(가드레일) 및 정책위반 처리, 트랜스크립트·음성 모델 내역 상세 설명

Q&A 통한 실전 개발자 질문(사용자 평가, 테스트, wake word, 가격 정책 등) 답변

감정·톤·자연스러운 대화·속도 등 실제 ‘사람 같은 음성’ 붙이기 기법 심화 시연

자료/리소스 안내 및 실전 최적화 요령 마무리


수정 요청하기

Previous Post
Forget RAG Pipelines-Build Production Ready Agents in 15 Mins: Nina Lopatina, Rajiv Shah, Contextual
Next Post
From Mixture of Experts to Mixture of Agents with Super Fast Inference - Daniel Kim & Daria Soboleva