Skip to content
Go back

[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents - Daniel Han

Published:  at  08:45 AM
YouTube Thumbnail

영상 링크: [Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han
채널명: AI Engineer

강화학습, 커널, 추론, 양자화, 에이전트 — Daniel Han 전체 워크숍 핵심 요약


세부 요약 - 주제별 정리

Daniel Han의 오픈소스 AI 활동과 unsloth 패키지의 주요 성과


LLM(대형언어모델) 트레이닝 역사와 오픈소스 혁신의 흐름


LLM 학습·파인튜닝 전체 구조와 각 단계별 핵심 개념


강화학습·에이전트 기본 개념과 LLM에의 확장 방식


PPO, GRPO 등 RL 알고리즘 상세 비교 및 수식/실전 적용법


RL 기반 활용 실습: unsloth + Colab/Kaggle 데모 노트북 구조


보상함수(Reward Function) 설계 예시와 수치 기반 실전 사례들


프롬프트와 Supervised Fine-Tuning(SFT) 프라이밍의 중요성


양자화(Quantization) 심층 분석과 최신 트렌드 소개


RL 보상 설계의 한계와 LLM Judge(모델 채점) 활용 논란, 오픈소스의 미래


최신 커널·훈련 프레임워크·옵션 최적화(Torch Compile 등)


추천 자료, 참고문헌, 실험 도구와 커뮤니티 활동 연계


엔지니어링 실무 관점: 실험 설계, 파라미터 튜닝, 에러 대응법



수정 요청하기

Previous Post
A Taxonomy for Next-gen Reasoning - Nathan Lambert, Allen Institute (AI2) & Interconnects.ai
Next Post
Context Engineering 101 - The Simple Strategy to 100x AI Coding