Posts
모든 글 보기
-
Engineering Better Evals: Scalable LLM Evaluation Pipelines That Work - Dat Ngo, Aman Khan, Arize
Published: at 05:19 PM영상은 Arize AI의 AI 아키텍트 Dat Ngo가 LLM(대규모 언어 모델) 평가(Eval) 파이프라인을 어떻게 효율적이고 확장성 있게 구축할 수 있는지 실무적 관점에서 설명
-
Why should anyone care about Evals? - Manu Goyal, Braintrust
Published: at 08:46 AM영상의 발표자 마누 고얄(Manu Goyal)은 Braintrust에서 일하며 AI 평가(Evals) 플랫폼 개발을 주도하고 있음 발표는 자신의 어린 시절과 기술에 대한 실망, 그
-
Evals 101 - Doug Guthrie, Braintrust
Published: at 08:46 AM**‘Evals(평가)’는 대형언어모델(LLM) 기반 애플리케이션의 품질, 신뢰성, 정확성 등을 정량적으로 관리할 수 있게 해 주는 구조화된 테스트 체계로, Braintrust 플
-
Building Agents at Cloud Scale - Antje Barth, AWS
Published: at 08:45 AM본 영상은 Antje Barth(AWS)가 클라우드 환경에서 대규모 AI 에이전트(Agent)를 구축하는 방법과 실제 적용 사례를 소개 전 세계에 6억 대가 넘는 Alexa 기기가